Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 11: Máy vector hỗ trợ (SVM). Chương này cung cấp cho học viên những nội dung về: giới thiệu máy vectơ hỗ trợ; siêu phẳng phân tách; phân tách tuyến tính (linear separability); bài toán cực tiểu hóa có ràng buộc đẳng thức; . Mời các bạn cùng tham khảo chi tiết nội dung bài giảng! | 1 Nhập môn Học máy và Khai phá dữ liệu IT3190 2 Nội dung môn học Lecture 1 Giới thiệu về Học máy và khai phá dữ liệu Lecture 2 Thu thập và tiền xử lý dữ liệu Lecture 3 Hồi quy tuyến tính Linear regression Lecture 4 5 Phân cụm Lecture 6 Phân loại và Đánh giá hiệu năng Lecture 7 dựa trên láng giềng gần nhất KNN Lecture 8 Cây quyết định và Rừng ngẫu nhiên Lecture 9 Học dựa trên xác suất Lecture 10 Mạng nơron Neural networks Lecture 11 Máy vector hỗ trợ SVM Lecture 12 Khai phá tập mục thường xuyên và các luật kết hợp Lecture 13 Thảo luận ứng dụng học máy và khai phá dữ liệu trong thực tế 3 Máy vectơ hỗ trợ Giới thiệu 1 Máy vectơ hỗ trợ Support vector machine - SVM được đề cử bởi V. Vapnik và các đồng nghiệp của ông vào những năm 1970s ở Nga và sau đó đã trở nên nổi tiếng và phổ biến vào những năm 1990s SVM là một phương pháp phân lớp tuyến tính linear classifier với mục đích xác định một siêu phẳng hyperplane để phân tách hai lớp của dữ liệu. Ví dụ lớp có nhãn dương positive và lớp có nhãn âm negative Các hàm nhân kernel functions cũng được gọi là các hàm biến đổi transformation functions được dùng cho các trường hợp phân lớp phi tuyến 4 Máy vectơ hỗ trợ Giới thiệu 2 SVM có một nền tảng lý thuyết chặt chẽ SVM là một phương pháp tốt phù hợp đối với những bài toán phân lớp có không gian rất nhiều chiều các đối tượng cần phân lớp được biểu diễn bởi một tập rất lớn các thuộc tính SVM đã được biết đến là một trong số các phương pháp phân lớp tốt nhất đối với các bài toán phân lớp văn bản text classification 5 Máy vectơ hỗ trợ Giới thiệu 3 Các vectơ được ký hiệu bởi các chữ đậm nét Biểu diễn tập r các quan sát x1 y1 x2 y2 xr yr xi là một vectơ đầu vào được biểu diễn trong không gian X Rn yi là một nhãn lớp giá trị đầu ra yi 1 -1 yi 1 lớp dương positive yi -1 lớp âm negative SVM xác định một hàm phân tách tuyến tính f x w x b w là vectơ trọng số các thuộc tính b là một giá trị số thực 1 if w xi b 0 Sao cho với mỗi xi yi 1 if w xi b 0 6 Siêu phẳng phân tách Siêu .