Tóm tắt Luận án Tiến sĩ Khoa học máy tính:(trùng) Một số phương pháp phục vụ xếp hạng trang Web trong tìm kiếm xuyên ngữ

Mục tiêu nghiên cứu của đề tài là nghiên cứu và đề xuất các phương pháp phục vụ dịch thuật, bao gồm các kỹ thuật tiền xử lý câu truy vấn, dịch câu truy vấn và xử lý câu truy vấn ở ngôn ngữ đích cũng như nghiên cứu và đề xuất các phương pháp xếp hạng lại danh sách kết quả tìm kiếm trong truy vấn xuyên ngữ, chú trọng việc xếp hạng các trang Web. Thước đo hiệu quả chính được sử dụng là điểm MAP (Mean Average Precision) | BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG Lâm Tùng Giang MỘT SỐ PHƯƠNG PHÁP PHỤC VỤ XẾP HẠNG CÁC TRANG WEB TRONG TÌM KIẾM XUYÊN NGỮ Chuyên ngành Khoa học máy tính Mã số 62 48 01 01 TÓM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG - 2017 Công trình được hoàn thành tại Trường Đại học Bách khoa Đại học Đà Nẵng Cán bộ hướng dẫn khoa học - . Võ Trung Hùng - . Huỳnh Công Pháp Phản biện 1 GS. TS. Hoàng Văn Kiếm Phản biện 2 PGS. TS. Lê Mạnh Thạnh Phản biện 3 PGS. TS. Phan Huy Khánh Luận án được bảo vệ trước Hội đồng chấm luận án cấp Đại học Đà nẵng họp tại Đại học Đà Nẵng vào hồi 14h00 giờ ngày 26 tháng 5 năm 2017 LỜI MỞ ĐẦU Tìm kiếm web xuyên ngữ đặt ra nhiệm vụ từ nhu cầu thông tin của người dùng được trình bày ở một ngôn ngữ ngôn ngữ nguồn thực hiện việc xác định các trang web phù hợp được viết bằng một ngôn ngữ khác ngôn ngữ đích . Xếp hạng trong tìm kiếm Web xuyên ngữ liên quan đến việc tạo lập kết quả khi thực hiện một câu truy vấn ở dạng một danh sách các tài liệu theo thứ tự phù hợp với nhu cầu truy vấn. Nhằm thực hiện việc xếp hạng trong truy vấn thông tin nói chung và trong bài toán tìm kiếm Web xuyên ngữ nói riêng cần giải quyết hai nhiệm vụ trọng tâm Thứ nhất là nhiệm vụ dịch thuật nhằm biểu diễn câu truy vấn và các tài liệu trong một không gian chung cụ thể là trong cùng một ngôn ngữ. Thứ hai là nhiệm vụ xếp hạng thông qua việc triển khai các giải pháp kỹ thuật các thước đo nhằm đánh giá so sánh mức độ phù hợp giữa các tài liệu và câu truy vấn. Một số hạn chế của các giải pháp hiện tại bao gồm chất lượng dịch thuật thấp và sự lệ thuộc vào cặp ngôn ngữ. Với các hệ thống tìm kiếm liên quan tiếng Việt các vấn đề về xử lý ngôn ngữ cũng như dịch thuật đã khiến hiệu quả xếp hạng kết quả tìm kiếm còn rất hạn chế. Bên cạnh đó một hệ thống tìm kiếm Web cần có thiết kế riêng biệt so với một hệ thống truy vấn thông tin văn bản truyền thống nhằm khai thác cấu trúc đặc thù của các tài liệu HTML phục vụ quá trình xếp hạng. Từ các hạn chế đã nêu phát sinh nhu .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.