Bài giảng khai phá dữ liệu web: Giới thiệu môn học sẽ giới thiệu tới các bạn về vấn đề khai phá Text và khai phá Web: khái niệm, đặc trưng và phân loại; một số kiến thức Toán học cho khai phá dữ liệu web: Toán học Internet, Mô hình đồ thị, Học máy xác suất Bayes; khai phá sử dụng web: Phân tích mẫu truy nhập Web, Phân tích xu hướng cá nhân;. | BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB GIỚI THIỆU MÔN HỌC – K18 PGS. TS. HÀ QUANG THỤY HÀ NỘI 09-2012 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI Giới thiệu chung về môn học Tên môn học: Khai phá dữ liệu Web Số tín chỉ: 2 Tài liệu dạy - học: Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Hà Quang Thụy (chủ biên), Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009). Giáo trình Khai phá dữ liệu Web, NXBGD, Hà Nội, 2009. Tài liệu làm tiểu luận David Easley, Jon Kleinberg (2010). Networks, Crowds, and Markets: Reasoning about a Highly Connected World, Cambridge University Press. Tài liệu tham khảo Bing Liu (2011). Web Data Mining: Exploring Hyperlinks, Contents and Usage Data (2nd Edition), Springer. Nguyễn Hà Nam, Nguyễn Trí Thành, Hà Quang Thụy (2012). Giáo trình khai phá dữ liệu, ĐHQGHN. Vị trí của môn học CTĐT ThS HTTT Vị trí của môn học CTĐT ThS HTTT Nội dung môn học Khai phá Text và khai phá Web: khái niệm, đặc trưng và phân loại Một số kiến thức Toán học cho khai phá dữ liệu web: Toán học Internet, Mô hình đồ thị, Học máy xác suất Bayes Khai phá sử dụng web: Phân tích mẫu truy nhập Web, Phân tích xu hướng cá nhân, Khai phá cấu trúc Web: Khai phá đồ thị Web, Khai phá cấu trúc trang Web Các phương pháp biểu diễn văn bản và một số vấn đề về xử lý ngôn ngữ tiếng Việt cho khai phá dữ liệu web. Hệ thống tìm kiếm trên web: Bài toán, Cấu trúc và hoạt động của máy tìm kiếm, Crawling trang web, Phân tích và đánh chỉ số, Tính hạng trang Web, Máy tìm kiếm thực thể Bài toán phân cụm, đặc điểm, yêu cầu và ứng dụng, độ đo tương tự giữa các trang Web; Các thuật toán phân cụm web điển hình và đánh giá. Một mô hình phân cụm kết quả tìm kiếm và gán nhãn cụm tiếng Việt Phân lớp web: Bài toán phân lớp web và ứng dụng, Các thuật toán phân lớp: Phân lớp dựa trên hệ thống luật, thuật toán Bayes, cây quyết định, SVM, các thuật toán khác, phân lớp bán giám sát. Khuynh hướng phát triển của khai phá dữ liệu web. Tổ chức dạy - học Hình thức dạy-học: - Giáo . | BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB GIỚI THIỆU MÔN HỌC – K18 PGS. TS. HÀ QUANG THỤY HÀ NỘI 09-2012 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI Giới thiệu chung về môn học Tên môn học: Khai phá dữ liệu Web Số tín chỉ: 2 Tài liệu dạy - học: Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Hà Quang Thụy (chủ biên), Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009). Giáo trình Khai phá dữ liệu Web, NXBGD, Hà Nội, 2009. Tài liệu làm tiểu luận David Easley, Jon Kleinberg (2010). Networks, Crowds, and Markets: Reasoning about a Highly Connected World, Cambridge University Press. Tài liệu tham khảo Bing Liu (2011). Web Data Mining: Exploring Hyperlinks, Contents and Usage Data (2nd Edition), Springer. Nguyễn Hà Nam, Nguyễn Trí Thành, Hà Quang Thụy (2012). Giáo trình khai phá dữ liệu, ĐHQGHN. Vị trí của môn học CTĐT ThS HTTT Vị trí của môn học CTĐT ThS HTTT Nội dung môn học Khai phá Text và khai phá Web: khái niệm, đặc trưng và phân loại Một số kiến thức Toán