Bài giảng Khai phá web - Bài 4: Tìm kiếm thông tin

Bài giảng Khai phá web - Bài 4: Tìm kiếm thông tin. Bài này cung cấp cho học viên những nội dung về: các khái niệm cơ bản; các mô hình tìm kiếm thông tin; phản hồi liên quan; các phương pháp đánh giá; tiền xử lý văn bản; chỉ mục ngược; đánh chỉ mục ngữ nghĩa ẩn; tìm kiếm web; . Mời các bạn cùng tham khảo chi tiết nội dung bài giảng! | BÀI 4 TÌM KIẾM THÔNG TIN Nội dung 1. Các khái niệm cơ bản 2. Các mô hình tìm kiếm thông tin 3. Phản hồi liên quan 4. Các phương pháp đánh giá 5. Tiền xử lý văn bản 6. Chỉ mục ngược 7. Đánh chỉ mục ngữ nghĩa ẩn 8. Tìm kiếm web 9. Siêu tìm kiếm 10. Web spam 2 1. Các khái niệm cơ bản Tìm kiếm thông tin giúp người dùng tìm kiếm thông tin phù hợp với nhu cầu của họ Tìm kiếm thông tin nghiên cứu việc thu thập tổ chức lưu trữ truy hồi và phân phối thông tin Hệ thống tìm kiếm thông tin truyền thống coi văn bản là đơn vị cơ bản Người dùng với nhu cầu thông tin đưa ra một câu truy vấn tới hệ thống truy hồi thông qua các thao tác truy vấn. Thành phần truy hồi sử dụng chỉ mục văn bản để lấy các văn bản chứa các từ khóa trong câu truy vấn các văn bản này có nhiều khả năng phù hợp với câu truy vấn tính toán điểm phù hợp và xếp hạng các văn bản theo điểm. Các văn bản được xếp hạng được trả về cho người dùng. Tập văn bản CSDL văn bản được đánh chỉ mục để tăng hiệu quả truy vấn 3 Các khái niệm cơ bản tiếp Người dùng Tập văn bản phản hồi câu truy vấn Xử lý Bộ chỉ mục truy vấn các văn bản được xếp hạng Hệ thống Chỉ mục truy hồi văn bản 4 Các khái niệm cơ bản tiếp Các loại câu truy vấn 1. Truy vấn từ khóa Câu truy vấn gồm một danh sách các từ khóa. Các văn bản trả về có thể chứa một một vài hoặc tất cả các từ khóa. Trật tự của các từ khóa có thể được bảo đảm. Vd information retrieval 2. Truy vấn nhị phân Các từ khóa được kết hợp bởi các thao tác nhị phân AND OR và NOT. Vd information OR retrieval 3. Truy vấn cụm Gồm một chuỗi các từ hình thành nên một cụm. Văn bản trả về phải chứa cụm truy vấn. Vd information retrieval systems 4. Truy vấn lân cận Xếp hạng các văn bản dựa trên độ lân cận của các từ khóa trong câu truy vấn 5. Truy vấn văn bản Tìm kiếm các văn bản tương tự văn bản truy vấn 6. Hỏi đáp Câu truy vấn dưới dạng câu hỏi tự nhiên hệ thống trả về câu trả lời. vd câu hỏi định nghĩa 5 Các khái niệm cơ bản tiếp Xử lý truy vấn bao gồm các thao tác tiền xử lý như loại bỏ từ dừng các

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.