Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 7, chương này cung cấp cho học viên những nội dung về: phân lớp; cây quyết định (Decision tree); học cây quyết định (Decision tree –DT– learning); biểu diễn cây quyết định; giải thuật ID3; học cây quyết định và chiến lược tìm kiếm; . Mời các bạn cùng tham khảo chi tiết nội dung bài giảng! | Nhập môn Học máy và Khai phá dữ liệu IT3190 Nguyễn Nhật Quang Trường Đại học Bách Khoa Hà Nội Viện Công nghệ thông tin và truyền thông Năm học 2020-2021 Nội dung môn học Giới thiệu về Học máy và Khai phá dữ liệu Tiền xử lý dữ liệu Đánh giá hiệu năng của hệ thống Hồi quy Phân lớp Cây quyết định Decision tree Phân cụm Phát hiện luật kết hợp Nhập môn Học máy và Khai phá dữ liệu Introduction to Machine learning and Data mining 2 Học cây quyết định Giới thiệu Học cây quyết định Decision tree DT learning Để học xấp xỉ một hàm mục tiêu có giá trị rời rạc discrete- valued target function hàm phân lớp Hàm phân lớp được biểu diễn bởi một cây quyết định Một cây quyết định có thể được biểu diễn diễn giải bằng một tập các luật IF-THEN dễ đọc và dễ hiểu Học cây quyết định có thể thực hiện ngay cả với các dữ liệu có chứa nhiễu lỗi noisy data Là một trong các phương pháp học quy nạp inductive learning được dùng phổ biến nhất Được áp dụng thành công trong rất nhiều các bài toán ứng dụng thực tế Nhập môn Học máy và Khai phá dữ liệu Introduction to Machine learning and Data mining 3 Ví dụ về DT Những tin tức nào mà tôi quan tâm sport is present is absent player football is present is absent is present is absent Interested Uninterested Interested goal is present is absent Interested Uninterested sport player Interested goal Interested sport Uninterested Nhập môn Học máy và Khai phá dữ liệu Introduction to Machine learning and Data mining 4 Ví dụ về DT Một người có chơi tennis không Outlook Sunny Rain Overcast Humidity Yes Wind High Normal Strong Weak No Yes No Yes Outlook Overcast Temperature Hot Humidity High Wind Weak Yes Outlook Rain Temperature Mild Humidity High Wind Strong No Outlook Sunny Temperature Hot Humidity High Wind Strong No Nhập môn Học máy và Khai phá dữ liệu Introduction to Machine learning and Data mining 5 Biểu diễn cây quyết định 1 Mỗi nút trong internal node biểu diễn một thuộc tính cần kiểm tra giá trị an attribute to be tested đối