Bài tập lớn môn Kho dữ liệu và khai phá dữ liệu: Tìm hiểu và xây dựng thuật toán K-means và KNN

Data mining là lĩnh vực đóng vai trò quan trọng trong việc phân tích và quản lý dữ liệu. Dựa vào đó chúng ta có thể đưa ra những dự đoán cho kế hoạch tương lai. Trong thời buổi công nghệ ngày càng phát triển như hiện nay, việc áp dụng khoa học công nghệ thông tin vào quá trình xử lý và phân tích dữ liệu là vô cùng cần thiết. Data mining chính là một trong số đó. Mời các bạn cùng tham khảo tài liệu để nắm chi tiết hơn các nội dung nghiên cứu. | HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG BÁO CÁO BÀI TẬP LỚN KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU Đề tài Tìm hiểu và xây dựng thuật toán K-means và KNN Giảng viên hướng dẫn Cô Nguyễn Quỳnh Chi Nhóm thực hiện Nhóm 10 Thành viên Bùi Trung Hiếu B17DCCN224 Trần Minh Tân B17DCCN552 Bùi Văn Đông B17DCCN132 Nguyễn Như Tuấn B17DCCN659 Vương Đình Hiếu B17DCCN247 1 Phân công công việc Thành viên Công việc Bùi Trung Hiếu Tìm hiểu code và dataset Trần Minh Tân Tìm hiểu và xây dựng code tài liệu Bùi Văn Đông Tìm hiểu code xây dựng tài liệu Nguyễn Như Tuấn Xây dựng tài liệu Vương Đình Hiếu Xây dựng tài liệu 2 Giới thiệu Data mining là lĩnh vực đóng vai trò quan trọng trong việc phân tích và quản lý dữ liệu. Dựa vào đó chúng ta có thể đưa ra những dự đoán cho kế hoạch tương lai. Trong thời buổi công nghệ ngày càng phát triển như hiện nay việc áp dụng khoa học công nghệ thông tin vào quá trình xử lý và phân tích dữ liệu là vô cùng cần thiết. Data mining chính là một trong số đó. Sau đây chúng ta sẽ cùng nhau tìm hiểu về Data mining. 3 Contents I. Data mining 3 1. Khái niệm 3 2. Các kỹ thuật quan trọng 3 a. Kỹ thuật phân tích phân loại Classification Analysis 3 b. Kỹ thuật Association Rule Learning 4 c. Kỹ thuật phát hiện bất thường Anomaly or Outlier Detection 4 d. Kỹ thuật phân tích theo cụm Clustering Analysis 4 e. Kỹ thuật dự báo prediction 4 f. Kỹ thuật Sequential Patterns 5 g. Kỹ thuật Decision Trees 5 II. K-Mean 6 1. Khái niệm 6 2. Ý tưởng của thuật toán k-means 7 3. Một số lưu ý 7 a. Lựa chọn số cụm 7 b. Khởi tạo K vị trí ban đầu 7 c. Về vấn đề tính dừng hội tụ 7 III. KNN K-Nearest Neighbors 9 1. Giới thiệu 9 2. Khái niệm 9 3. Thuật toán 10 4. Ứng dụng 10 4 I. Data mining Data Mining là một trong những thuật ngữ mới xuất hiện đầu thế kỷ 21 nó là hệ quả của sự bùng nổ Internet đạt tới đỉnh điểm. Theo một công bố của Intel vào tháng 9 năm 2013 cứ 11 giây trôi qua chúng ta có thêm 1 Petabybe dữ liệu nó tương đương với một video chất lượng HD dài 13 năm. Và để khai phá trích

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
130    46    1    28-03-2024
119    8    1    28-03-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.