Các phân xây mô hình cho : Gán các vào các chính xác cao có . Cho CSDL D={t1,t2, ,tn} và các C={C1, ,Cm}, phân là bài toán xác ánh f : D C sao cho ti gán vào. Phân lớp khách hàng (trong ngân hàng) để cho vay hay không. Dự đoán tế bào khối u lành tính hay ác tính. | KHAI THÁC DỮ LIỆU ÚNG DỤNG DATA MINING GV NGUYỄN HOÀNG TỦ ANH 1 BÀI 4 - PHÂN 1 PHÂN LỚP Dữ LIỆU 2 1 NỘI DUNG p 1. Giới thiệu 2. Phương pháp dựa trên cây quyết định 3. Phương pháp dựa trên luật 3 GIỚI THIỆU 1. Phân lớp . Cho tập các mẫu đã phân lớp trước xây dựng mô hình cho từng lớp Muc đích Gán các mẫu mới vào các lớp với độ chính xác cao nhất có thể. Cho CSDL D t t2 . tn và tập các lớp C C1 Cm phân lớp là bài toán xác định ánh xạ f D C sao cho mỗi ti được gán vào một lớp. 4 2 Glơl THIEU Ví du Phân lớp . Phân lớp khách hàng trong ngân hàng để cho vay hay không . Dự đoán tế bào khối u là lành tính hay ác tính . Phân loại giao dịch thẻ tín dụng là hợp pháp hay gian lận . Phân loại tin tức thuộc lĩnh vực tài chính thời tiết giải trí thể thao . . Dự đoán khi nào sông có lũ . Chuẩn đoán y khoa 5 GIỚI THIỆU ệ --------------- 2. Qui trình phân lớp Bước 1 Xây dựng mô hình Mô tả tập các lớp xác định trước Tập huấn luyện các mẫu bộ dành cho xây dựng mô hình Mỗi mẫu bộ thuộc về một lớp đã định nghĩa trước Tìm luật phân lóp cây quyết định hoặc công thức toán mô tả lớp 6