Bài viết Công cụ cho trích xuất dữ liệu thực thể, quan hệ giữa thực thể và hỗ trợ phân tích dữ liệu trong các tạp chí về phòng chống dịch bệnh trong nông nghiệp của Pháp trình bày Trích xuất thực thể là công việc trích xuất thông tin và phân loại thông tin trong văn bản theo những loại xác định trước như tên người, tổ chức, địa điểm, thời gian,. . | J. Sci. & Devel. 2015, Vol. 13, No. 6: 976-988 Tạp chí Khoa học và Phát triển 2015, tập 13, số 6: 976-988 CÔNG CỤ CHO TRÍCH XUẤT DỮ LIỆU THỰC THỂ, QUAN HỆ GIỮA THỰC THỂ VÀ HỖ TRỢ PHÂN TÍCH DỮ LIỆU TRONG CÁC TẠP CHÍ VỀ PHÒNG CHỐNG DỊCH BỆNH TRONG NÔNG NGHIỆP CỦA PHÁP Phan Trọng Tiến*, Ngô Công Thắng Khoa Công nghệ Thông tin, Học viện Nông nghiệp Việt Nam Email*: ptgtien@ Ngày gửi bài: Ngày chấp nhận: TÓM TẮT Trích xuất thực thể là công việc trích xuất thông tin và phân loại thông tin trong văn bản theo những loại xác định trước như tên người, tổ chức, địa điểm, thời gian, và một bước cao hơn là tìm mỗi quan hệ giữa các thực thể ví dụ như mỗi quan hệ giữa tên người với tên tổ chức. Công cụ được xây dựng để làm công việc như vậy, công cụ sử dụng các từ điển cho thực thể và các luật để trích xuất. Trong trích xuất quan hệ giữa các thực thể chúng tôi áp dụng hai phương pháp: phân tích cấu trúc của văn bản và sử dụng mô hình học không giám sát đó là phân tích tần suất xuất hiện của các thực thể. Công cụ có sẵn trên trang chủ R theo đường dẫn: http: // . Từ khoá: Automat hữu hạn, nhận biết thực thể định danh, Perl, R, trích xuất thông tin, trích xuất thực thể, trích xuất quan hệ. Package for Extraction of Entities, Relationships between Entities and Support Data Analysis in Epidemiological Journals in French Agriculture ABSTRACT Entity extraction is a task of information extraction and element classification in text such as the names of persons, organizations, locations, times, etc. and to find relationship between entities such as the relationship between the names of persons with the organizations. The tool was built solve this task. It uses dictionaries matching and hand - crafted rules to extract. In extracting the relationship between the entities, we applied two methods: analysis of text structures and unsupervised learning approach .