Nội dung chính của đồ án tốt nghiệp gồm 3 chương: Chương 1 - Trình bày các kiến thức cơ bản về khám phá tri thức, khai phá dữ liệu, một số vấn đề về biểu diễn và xử lý dữ liệu văn bản áp dụng trong khai phá dữ liệu. Chương 2 - Giới thiệu một số thuật toán phân cụm dữ liệu phổ biến và thường được sử dụng trong lĩnh vực khai phá dữ liệu Web. Chương 3 - Trình bày khai phá nội dung Web và tiếp cận theo hướng sử dụng các kỹ thuật phân cụm dữ liệu để giải quyết bài toán khai phá dữ liệu Web. | Đồ án tốt nghiệp ngành Công nghệ thông tin: Áp dụng các phương pháp phân cụm trong khai phá dữ liệu Web BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG -------o0o------- ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ THÔNG TIN BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG HẢI PHÒNG 2016 -------o0o------- KẾT HỢP CÁC PHƢƠNG PHÁP PHÂN CỤM TRONG KHAI PHÁ DỮ LIỆU WEB ĐỒ ÁN TỐT NGHIỆP HỆ ĐẠI HỌC CHÍNH QUY Ngành: Công nghệ Thông tin H¶i Phßng 2016 HẢI PHÒNG 2016 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG -------o0o------- KẾT HỢP CÁC PHƢƠNG PHÁP PHÂN CỤM TRONG KHAI PHÁ DỮ LIỆU WEB ĐỒ ÁN TỐT NGHIỆP HỆ ĐẠI HỌC CHÍNH QUY Ngành: Công nghệ Thông tin Sinh viên thực hiện: Cao Hữu Hải Giáo viên hƣớng dẫn: Nguyễn Trịnh Đông Mã sinh viên: 1212101007 HẢI PHÒNG 2016 BỘ GIÁO DỤC VÀ ĐÀO TẠO CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG Độc lập – Tự do – Hạnh phúc -------o0o------- NHIỆM VỤ THIẾT KẾ TỐT NGHIỆP Sinh viên: Cao Hữu Hải Mã số: 1212101007 Lớp:CT1601 Ngành: Công nghệ Thông tin Tên đề tài: Kết hợp các phƣơng pháp phân cụm trong khai phá dữ liệu Web NHIỆM VỤ ĐỀ TÀI 1. Nội dung và các yêu cầu cần giải quyết trong nhiệm vụ đề tài tốt nghiệp. a. Nội dung: - Tìm hiểu về khai phá dữ liệu, khai phá dữ liệu Web. - Tìm hiểu các thuật toán phân cụm phổ biến. - Áp dụng các thuật toán phân cụm trong tìm kiếm và phân cụm tài liệu Web. - Đề ra phƣơng pháp xây dựng hệ thống. - Thử nghiệm với các công cụ để giải quyết bài toán. b. Các yêu cầu cần giải quyết. - Nắm đƣợc lý thuyết về khai phá dữ liệu Web. - Nắm đƣợc các thuật toán phân cụm dữ liệu. - Nắm đƣợc quá trình phân cụm dữ liệu Web. - Xây đựng đƣợc mô hình phân cụm dữ liệu với phần mền Orange. 2. Các số liệu cần thiết để thiết kế, tính toán 3. Địa điểm thực tập CÁN BỘ HƢỚNG DẪN ĐỀ TÀI TỐT NGHIỆP Ngƣời hƣớng dẫn thứ nhất: Họ và tên: Nguyễn Trịnh Đông Học hàm, học vị: Thạc sĩ Cơ .