Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 4+5: Phân cụm

Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 4+5: Phân cụm. Chương này cung cấp cho học viên những nội dung về: bài toán học có giám sát (Supervised learning) và bài toán học không giám sát (Unsupervised learning); giải thuật phân cụm; đánh giá chất lượng phân cụm (Clustering quality); . Mời các bạn cùng tham khảo chi tiết nội dung bài giảng! | 1 Nhập môn Học máy và Khai phá dữ liệu IT3190 2 Nội dung môn học Lecture 1 Giới thiệu về Học máy và khai phá dữ liệu Lecture 2 Thu thập và tiền xử lý dữ liệu Lecture 3 Hồi quy tuyến tính Linear regression Lecture 4 5 Phân cụm Lecture 6 Phân loại và Đánh giá hiệu năng Lecture 7 dựa trên láng giềng gần nhất KNN Lecture 8 Cây quyết định và Rừng ngẫu nhiên Lecture 9 Học dựa trên xác suất Lecture 10 Mạng nơron Neural networks Lecture 11 Máy vector hỗ trợ SVM Lecture 12 Khai phá tập mục thường xuyên và các luật kết hợp Lecture 13 Thảo luận ứng dụng học máy và khai phá dữ liệu trong thực tế 3 1. Hai bài toán học Học có giám sát Supervised learning Tập dữ liệu học training data bao gồm các quan sát examples observations mà mỗi quan sát được gắn kèm với một giá trị đầu ra mong muốn. Ta cần học một hàm vd một phân lớp một hàm hồi quy . phù hợp với tập dữ liệu hiện có. Hàm học được sau đó sẽ được dùng để dự đoán cho các quan sát mới. Học không giám sát Unsupervised learning Tập học training data bao gồm các quan sát mà mỗi quan sát không có thông tin về nhãn lớp hoặc giá trị đầu ra mong muốn. Mục đích là tìm ra học các cụm các cấu trúc các quan hệ tồn tại ẩn trong tập dữ liệu hiện có. 4 Ví dụ về học không giám sát 1 Phân cụm clustering Phát hiện các cụm dữ liệu cụm tính chất Community detection Phát hiện các cộng đồng trong mạng xã hội 5 Ví dụ về học không giám sát 2 Trends detection Phát hiện xu hướng thị yếu Entity-interaction analysis 6 2. Phân cụm Phân cụm clustering Đầu vào một tập dữ liệu x1 xM không có nhãn hoặc giá trị đầu ra mong muốn Đầu ra các cụm nhóm của các quan sát Một cụm cluster là một tập các quan sát Tương tự với nhau theo một ý nghĩa đánh giá nào đó Khác biệt với các quan sát thuộc các cụm khác Sau khi phân cụm 7 Phân cụm Giải thuật phân cụm Dựa trên phân hoạch Partition-based clustering Dựa trên tích tụ phân cấp Hierarchical clustering Bản đồ tự tổ thức Self-organizing map SOM Các mô hình hỗn hợp Mixture models Đánh giá chất lượng phân cụm Clustering .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.