Tóm tắt Luận án Tiến sĩ Kĩ thuật: Xây dựng mô hình rút trích thông tin văn bản theo chủ đề trong miền chuyên biệt (tin học)

Mục tiêu nghiên cứu của Luận án này nhằm xây dựng mô hình rút trích thông tin văn bản theo chủ đề trong miền chuyên biệt (Tin học) nhằm khắc phục những hạn chế của một số công trình nghiên cứu nêu trên. Mời các bạn cùng tham khảo! | KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA Kết luận Những khó khăn khi thực hiện luận án Dữ liệu rút trích từ Wikipedia không chỉ là tiếng Anh mà có thể tiếng Hoa nên phải xử lý thủ công để chọn các dữ liệu tiếng Anh TẠ DUY CÔNG CHIẾN Rút trích các mối quan hệ ngữ nghĩa không thể xử lý trọn vẹn vì danh sách các động từ tương ứng với các mối quan hệ là không bao phủ. Việc loại bỏ các dữ liệu trùng khớp mất nhiều thời gian. Tuy nhiên luận án đã đạt được những kết quả khả quan và đã được đánh giá qua nhiều thực nghiệm khác nhau XÂY DỰNG MÔ HÌNH RÚT TRÍCH THÔNG TIN VĂN BẢN Hướng phát triển trong tương lai THEO CHỦ ĐỀ TRONG MIỀN CHUYÊN BIỆT TIN HỌC Trong tương lai một số vấn đề của luận án cần được quan tâm nghiên cứu 1 Vấn đề 1 Làm giàu ontology Hiện tại hệ thống chỉ có thể làm giàu ontology với những tập tin văn bản XML có chủ đề trùng với 170 chủ đề của ontology và phải biết trước chủ Chuyên ngành KHOA HỌC MÁY TÍNH đề của những tập tin này. Trong tương lai hệ thống có thể mở rộng cho Mã số chuyên ngành phép làm giàu ontology trên những tập tin không biết trước chủ đề. Cho phép cập nhật tự động từ các bài báo khoa học hay các trang Web liên quan đến lĩnh vực Tin học định kỳ theo tuần theo tháng. Cho phép thêm chủ đề mới và tên các chuyên gia Tin học vào ontology TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT 2 Vấn đề 2 Bổ sung các quan hệ ngữ nghĩa giữa các đối tượng Ngoài các quan hệ ngữ nghĩa hiện có việc tìm ra các quan hệ ngữ nghĩa mới để bổ sung vào CDO là một trong các công việc cần được quan tâm và nghiên cứu. 3 Vấn đề 3 Tối ưu hóa các giải thuật Khi CDO có nhiều đối tượng hơn từ ba triệu trở lên thì cần phải tối ưu hóa các giải thuật để cải thiện tốc độ truy xuất trên CDO và khi đó giải pháp cơ sở dữ liệu TP. HỒ CHÍ MINH NĂM 2016 đồ thị Graph Database có thể được xét đến. 24 Công trình được hoàn thành tại Trường Đại học Bách Khoa ĐHQG-HCM Dựa vào cây phụ thuộc trong hình và mối quan hệ cú pháp giữa các từ trong .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.