Bài giảng Khai phá dữ liệu: Bài 1 Tổng quan về khai phá dữ liệu cung cấp cho người học những kiến thức như: Giới thiệu chung; Khai phá dữ liệu là gì; Quá trình khai phá tri thức; Các kỹ thuật áp dụng trong khai phá dữ liệu; Ứng dụng khai phá dữ liệu. Mời các bạn cùng tham khảo! | KHAI PHÁ DỮ LIỆU Bài 1. Tổng quan về khai phá dữ liệu Giáo viên TS. Trần Mạnh Tuấn Bộ môn Hệ thống thông tin Khoa Công nghệ thông tin Email tmtuan@ Điện thoai 1 Nội dung 1 Giới thiệu chung 2 Khai phá dữ liệu là gì 3 Quá trình khai phá tri thức 4 Các kỹ thuật áp dụng trong KPDL 5 Ứng dụng khai phá dữ liệu 2 GIỚI THIỆU CHUNG Tình huống 1 3 GIỚI THIỆU CHUNG Tình huống 2 4 GIỚI THIỆU CHUNG Tình huống 3 5 GIỚI THIỆU CHUNG Tình huống 4 6 GIỚI THIỆU CHUNG Những năm 60 bắt đầu sử dụng công cụ tin học để tổ chức khai thác các CSDL Khả năng thu thập lưu trữ xử lý phân tích dữ liệu của các hệ thống thông tin không ngừng thay đổi Lượng thông tin ngày càng tăng lên Hướng tiếp cận mới về khai thác thông tin đưa ra các quyết định tư vấn 7 KHAI PHÁ DỮ LIỆU 8 KHAI PHÁ DỮ LIỆU Khai phá dữ liệu là một lĩnh vực nhằm tự động khai thác những thông tin tri thức đang tiềm ẩn trong dữ liệu. Khai phá dữ liệu là một lĩnh vực phát triển bền vững mang lại nhiều lợi ích triển vọng ưu thế hơn hẳn so với các công cụ phân tích dữ liệu truyền thống Các kỹ thuật được áp dụng dựa trên CSDL học máy trí tuệ nhân tạo lý thuyết thông tin xác suất thống kê và tính toán hiệu năng cao. 9 KHAI PHÁ DỮ LIỆU Có nhiều quan điểm khác nhau về Khai phá dữ liệu. Khai phá tri thức trong CSDL Knowledge Discovery in Databases - KDD là mục tiêu chính của Khai phá dữ liệu. Khai phá dữ liệu là một bước chính trong khai phá tri thức. 10 Quá trình khám phá tri thức Quy trình khám phá tri thức Biểu diễn tri thức Đánh giá Các mẫu Data Tri và giải Mining thức thích Dữ Trích chọn Dữliệu Biến đổi Tiền xửlý Dữliệu liệu dữliệu dữliệu dữliệu thô Tiền xửlý 11 Quá trình khám phá tri thức Các giai đoạn khai phá tri thức Trích chọn dữ liệu trích chọn những tập dữ liệu cần khai phá từ các tập dữ liệu khác nhau theo một tiêu chí nhất định. Tiền xử lý dữ liệu Làm sạch dữ liệu Rút gọn dữ liệu Rời rạc hoá dữ liệu Sau bước này dữ liệu sẽ được nhất quán và đồng nhất 12 Quá trình khám phá tri thức Các giai đoạn khai phá