Bài giảng Nhập môn khai phá dữ liệu (PGS.TS. Hà Quang Thụy) - Chương 3. Tiền xử lý dữ liệu

Đánh giá dữ liệu Định vị một vấn đề trong dữ liệu cần giải quyết: Tìm ra và quyết định cách nắm bắt vấn đề Mô tả dữ liệu sẽ làm hiện rõ một số vấn đề Kiểm toán dữ liệu: lập hồ sơ dữ liệu và phân tích ảnh hưởng của dữ liệu chất lượng kém. | 5/14/2020 1:09:58 AM Khai phá dữ liệu: Chương 3 Bài giảng môn học KHAI PHÁ DỮ LIỆU CHƯƠNG 3. TIỀN XỬ LÝ DỮ LIỆU 5/14/2020 1:09:58 AM Tài liệu tham khảo [HK06] J. Han and M. Kamber (2006). Data Mining-Concepts and Techniques (Second Edition), Morgan Kaufmann. Chapter 2. Data Preprocessing [NEM09] Robert Nisbet, John Elder, and Gary Miner (2009). Handbook of Statistical Analysis and Data Mining, Elsevier, 6/2009. Chapter 4. Data Understanding and Preparation; Chapter 5. Feature Selection. [Chap05] Chapman, A. D. (2005). Principles of Data Cleaning, Report for the Global Biodiversity Information Facility, Copenhagen [Chap05a] Chapman, A. D. (2005a). Principles and Methods of Data Cleaning – Primary Species and Species- Occurrence Data (version ), Report for the Global Biodiversity Information Facility, Copenhagen [Hai02] Đoàn An Hải (2002). Learning to Map between Structured Representations of Data, PhD Thesis, The University of Washington, ACM 2003 Award Winners and . | 5/14/2020 1:27:47 AM Khai phá dữ liệu: Chương 3 Bài giảng môn học KHAI PHÁ DỮ LIỆU CHƯƠNG 3. TIỀN XỬ LÝ DỮ LIỆU 5/14/2020 1:27:47 AM Tài liệu tham khảo [HK06] J. Han and M. Kamber (2006). Data Mining-Concepts and Techniques (Second Edition), Morgan Kaufmann. Chapter 2. Data Preprocessing [NEM09] Robert Nisbet, John Elder, and Gary Miner (2009). Handbook of Statistical Analysis and Data Mining, Elsevier, 6/2009. Chapter 4. Data Understanding and Preparation; Chapter 5. Feature Selection. [Chap05] Chapman, A. D. (2005). Principles of Data Cleaning, Report for the Global Biodiversity Information Facility, Copenhagen [Chap05a] Chapman, A. D. (2005a). Principles and Methods of Data Cleaning – Primary Species and Species- Occurrence Data (version ), Report for the Global Biodiversity Information Facility, Copenhagen [Hai02] Đoàn An Hải (2002). Learning to Map between Structured Representations of Data, PhD Thesis, The University of Washington, ACM 2003 Award Winners and Fellows (Doctoral Dissertation Award). [RD00] Erhard Rahm, Hong Hai Do (2000). Data Cleaning: Problems and Current Approaches, IEEE Data Eng. Bull., 23(4): 3-13 (2000) và một số tài liệu khác 5/14/2020 1:27:47 AM Chapter 3: Tiền xử lý dữ liệu Hiểu dữ liệu và chuẩn bị dữ liệu Vai trò của tiền xử lý dữ liệu Làm sạch dữ liệu Tích hợp và chuyển dạng dữ liệu Rút gọn dữ liệu Rời rạc và sinh kiến trúc khái niệm 5/14/2020 1:27:47 AM Những vấn đề cơ bản để hiểu dữ liệu Cách thu thập được dữ liệu cần thiết để mô hình hóa: Data Acquisition Cách kết hợp dữ liệu tìm được từ các nguồn dữ liệu khác nhau Data Integeation. Mô tả dữ liệu Data Description Đánh giá chất lượng (sự sạch sẽ) của dữ liệu Data Assessment 5/14/2020 1:27:47 AM Thu thập dữ liệu Cách thu thập dữ liệu cần thiết để mô hình hóa Data Acquisition: Trích chọn dữ liệu theo câu hỏi từ CSDL tới tập tin phẳng Ngôn ngữ hỏi bậc cao truy nhập trực tiếp CSDL Kết nối mức thấp để truy nhập trực tiếp CSDL Loại bỏ ràng buộc không gian/thời .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
4    331    2    27-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.