Bài giảng Khai phá web - Bài 2: Học máy (Phần 3)

Bài giảng Khai phá web - Bài 2: Học máy (Phần 3). Bài này cung cấp cho học viên những nội dung về: các khái niệm cơ bản; thuật toán k-means; biểu diễn cụm; phân cụm phân cấp; hàm khoảng cách; chuẩn hóa dữ liệu; xử lý nhiều loại thuộc tính; . Mời các bạn cùng tham khảo chi tiết nội dung bài giảng! | BÀI 2 HỌC MÁY TIẾP Nội dung 1. Các khái niệm cơ bản 2. Thuật toán k-means 3. Biểu diễn cụm 4. Phân cụm phân cấp 5. Hàm khoảng cách 6. Chuẩn hóa dữ liệu 7. Xử lý nhiều loại thuộc tính 8. Phương pháp đánh giá 9. Khám phá các lỗ và vùng dữ liệu 10. Học LU 11. Học PU 1. Các k n cơ bản Phân cụm là quá trình tổ chức các phần tử DL thành các nhóm trong đó các thành viên có tính chất tương tự nhau. Mỗi cụm bao gồm các phần tử DL tương tự nhau và khác biệt so với các phần tử DL thuộc các nhóm khác Ứng dụng phân cụm nhóm khách hàng dựa theo sở thích để thiết kế chiến lược marketing phân cụm khách hàng dựa theo chỉ số cơ thể để bố trí sản xuất quần áo phân cụm bài báo để tổng hợp tin tức . 2. Thuật toán k-means Algorithm k-means k D 1 chọn k điểm DL làm centroid trung tâm của cụm 2 repeat 3 for mỗi điểm DL x D do 4 tính khoảng cách từ x tới mỗi centroid 5 gán x cho centroid gần nhất một centroid đại diện cho một cụm 6 endfor 7 tính toán lại các centroid dựa trên các cụm hiện tại 8 until the stopping criterion is met Thuật toan K-means tiếp Điều kiện hội tụ 1. Số điểm DL được gán lại nhỏ hơn một ngưỡng 2. Số centroid bị thay đổi nhỏ hơn một ngưỡng 3. Tổng bình phương lỗi nhỏ hơn một ngưỡng trong đó - k là số lượng cụm - Cj là cụm thứ j - mj là centroid của Cj véc-tơ trung bình của các điểm DL thuộc Cj - dist x mj là khoảng cách giữa x và mj A Lựa chọn ngẫu nhiên k centroid Vòng lặp 1 B Gán cụm C Tính lại centroid Vòng lặp 2 D Gán cụm E Tính lại centroid Vòng lặp 3 F Gán cụm G Tính lại centroid Thuật toán K-Means tiếp Algorithm disk-k-means k D 1 Chọn k điểm DL làm centroid mj j 1 . k 2 repeat 3 khởi tạo sj 0 j 1 . k 0 là véc-tơ với các thành phần bằng 0 4 khởi tạo nj 0 j 1 . k nj là số điểm trong cụm j 5 for mỗi điểm DL x D do 6 j argmin dist x mi 7 gán x cho cụm j 8 sj sj x 9 nj nj 1 10 endfor 11 mj sj nj j 1 . k 12 until đ k dừng thỏa mãn Thuật toán K-Means tiếp O tkn trong đó t là số vòng lặp k là số cụm n là số ví dụ trong DL huấn luyện Chỉ áp dụng cho DL tồn tại mean đối

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
136    330    2    27-04-2024
44    78    4    27-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.