Đang chuẩn bị liên kết để tải về tài liệu:
Luận văn: Phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai

Không đóng trình duyệt đến khi xuất hiện nút TẢI XUỐNG

Từ vấn đề trên người ta đã nghiên cứu và tạo ra Máy truy tìm web(Web search engine). Máy này có khả năng tìm kiếm thông tin linh hoạt , nhanh chóng và rất dễ sử dụng . Người sử dụng chỉ cần đặt câu hỏi truy vấn về vấn đề cần quan tâm là có được tập kết quả liên quan đến câu hỏi truy vấn đó.Hiện nay Google1, Altavista2, HotBot3, Lycos4, AllTheWeb5 là những máy truy tìm hiệu quả và đang được sử dụng rộng rãi | Phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai Mục lục CHƯƠNG 1. .4 VẤN ĐỀ TÌM KIẾM THÔNG TIN TRÊN WEB.4 1.1. Máy truy tìm Web.4 1.1.1. Web Crawler.5 1.1.2. Document Index lập chỉ mục tài liệu .5 1.1.3. Document Cache lưu trữ tài liệu .6 1.1.4. Document Ranking.6 1.1.5. Query Processor bộ xử lý truy vấn .6 1.1.6. Presentation interface giao diện trình bày .6 2.1. Trình bày kết quả tìm kiếm của máy truy tìm Web Google.7 CHƯƠNG II . 10 PHÂN CỤM TẬP KẾT QUẢ TÌM KIẾM WEB DựA VÀO TẬP THÔ DUNG SAI . . .10 2.1. Khái niệm phân cụm.10 2.2. Phân cụm tập kết quả tìm kiếm Web.10 2.2.1. Khái niệm.10 2.2.2. Phép đo độ tương tự.11 2.2.3. Đặc điểm . .ĩ. .12 2.2.4. Hiệu quả . 13 2.2.5. Yêu cầu.13 2.3. Lý thuyết tập thô.14 2.3.1. Giới thiệu.14 2.3.2. Quan hệ không thể phân biệt . 15 2.3.3. Hàm thuộc thô.16 2.3.4. Định nghĩa Hệ thông tin.16 2.3.5. Không gian xấp xỉ tổng quát Generalized approximation spaces . 19 2.4. Mô hình tập thô dung sai TRSM . 21 2.4.1. Không gian tolerance của các từ.21 2.4.2. Biểu diễn tài liệu.23 3. Phương pháp trọng số mở rộng đối với xấp xỉ trên.24 Chương III Giải thuật phân cụm tập kết quả tìm kiếm web.26 3.1. Giải thuật . 26 3.1.1. Tiền xử lý snippet.27 3.1.2. Trích chọn những từ đặc trưng của mỗi snippet.28 3.1.3. Sinh lớp tolerance.31 3.1.4. Giải thuật phân cụm K-means.34 3.1.5. Tạo nhãn cho mỗi nhóm.36 3.2. Một số thuật toán phân cụm không giám sát.37 3.2.1. Phương pháp phân hoạch.37 3.2.2. Phương pháp phân cấp . 37 1 Phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai LỜI CẢM ƠN Sau thời gian làm đồ án lời đầu tiên em xin cảm ơn thầy giáo huớng dẫn Th.s Nguyễn Trọng Thể đã tận tình hướng dẫn chỉ bảo và tạo mọi điều kiện thuận lợi để em hoàn thành tốt đồ án tốt nghiệp được giao. Em xin chân thành cảm ơn các thầy cô giáo trong khoa công nghệ thông tin trường Đại học dân lập Hải Phòng đã giảng dạy và cung cấp tất cả các kiến thức chuyên môn cần thiết và quý giá nhất. Ngoài ra chúng em còn được rèn luyện một tinh thần học tập và sáng .

Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.