Phân lớp hiệu quả tập dữ liệu lớn với giải thuật giảm gradient ngẫu nhiên

Bài viết trình bày giải thuật giảm gradient ngẫu nhiên sử dụng trong máy học véctơ hỗ trợ cho phân lớp nhanh tập dữ liệu lớn. Máy học véctơ hỗ trợ sử dụng hàm hinge loss trong phân lớp nhằm đạt được tính chất thưa trong lời giải. Tuy nhiên, do hàm hinge loss không khả vi là nguyên nhân làm chậm hội tụ đến lời giải khi áp dụng giải thuật giảm gradient ngẫu nhiên. Nghiên cứu thay thế hàm hinge loss được sử dụng trong vấn đề tối ưu của giải thuật máy học véctơ hỗ trợ bằng các hàm xấp xỉ, khả vi nhằm cải tiến tốc độ hội tụ của giải thuật giảm gradient ngẫu nhiên. | Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR 9 Cần Thơ ngày 4-5 8 2016 DOI PHÂN LỚP HIỆU QUẢ TẬP DỮ LIỆU LỚN VỚI GIẢI THUẬT GIẢM GRADIENT NGẪU NHIÊN Đỗ Thanh Nghị Phạm Thế Phi Khoa CNTT-TT Trường Đại học Cần Thơ Khu 2 Đường 3 2 Xuân Khánh Ninh Kiều TP. Cần Thơ dtnghi ptphi @ TÓM TẮT Trong bài viết này chúng tôi trình bày giải thuật giảm gradient ngẫu nhiên sử dụng trong máy học véctơ hỗ trợ cho phân lớp nhanh tập dữ liệu lớn. Máy học véctơ hỗ trợ sử dụng hàm hinge loss trong phân lớp nhằm đạt được tính chất thưa trong lời giải. Tuy nhiên do hàm hinge loss không khả vi là nguyên nhân làm chậm hội tụ đến lời giải khi áp dụng giải thuật giảm gradient ngẫu nhiên. Chúng tôi nghiên cứu thay thế hàm hinge loss được sử dụng trong vấn đề tối ưu của giải thuật máy học véctơ hỗ trợ bằng các hàm xấp xỉ khả vi nhằm cải tiến tốc độ hội tụ của giải thuật giảm gradient ngẫu nhiên. Kết quả thực nghiệm trên 2 tập dữ liệu văn bản lớn RCV1 twitter cho thấy hiệu quả của đề xuất sử dụng hàm xấp xỉ so với hàm hinge loss. Từ khóa Máy học véctơ hỗ trợ SVM giảm gradient ngẫu nhiên SGD phân lớp dữ liệu lớn. I. GIỚI THIỆU Máy học véctơ hỗ trợ Support Vector Machines - SVM Vapnik 1995 là lớp mô hình máy học hiệu quả để giải quyết các vấn đề phân lớp hồi quy phát hiện phần tử cá biệt. Máy học SVM đã được áp dụng thành công trong rất nhiều ứng dụng như nhận dạng mặt người phân loại văn bản phân loại bệnh ung thư tham khảo tại Guyon 1999 . Giải thuật máy học SVM có thể sử dụng các hàm hạt nhân kernel function cung cấp các mô hình có độ chính xác rất cao cho các vấn đề phân lớp và hồi quy phi tuyến trong thực tế. Mặc dù có được những ưu điểm kể trên giải thuật huấn luyện một mô hình SVM rất mất thời gian và tiêu tốn nhiều không gian bộ nhớ do phải giải bài toán quy hoạch toàn phương quadratic programming . Độ phức tạp tối thiểu của giải thuật huấn luyện mô hình SVM là bậc 2 so với số lượng phần tử dữ liệu

Diệp Anh 103 7 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

Phân lớp hiệu quả tập dữ liệu lớn với giải thuật giảm gradient ngẫu nhiên

7 82 1

Sáng kiến kinh nghiệm: Khai thác hiệu quả hệ thống câu hỏi trong dạy học phân môn Tập đọc lớp 4 nhằm phát triển năng lực học sinh

41 80 6

Thuật toán khai thác tập thường xuyên hiệu quả dựa trên kỹ thuật phân lớp dữ liệu

12 73 0

SKKN: Một số kinh nghiệm giúp học sinh học tập hiệu quả dạng văn tả cảnh trong phân môn Tập làm văn lớp 5

29 170 3

Sáng kiến kinh nghiệm Tiểu học: Biện pháp giúp học sinh lớp 4 học Tập làm văn – phần miêu tả – có hiệu quả

23 91 3

Sáng kiến kinh nghiệm Tiểu học: Một số biện pháp nhằm nâng cao hiệu quả dạy tập làm văn lớp 3 ở trường tiểu học

22 40 2

Sáng kiến kinh nghiệm Tiểu học: Một số biện pháp nâng cao hiệu quả dạy mở rộng vốn từ trong phân môn Luyện từ và câu lớp 2

16 146 3

SKKN: Sử dụng có hiệu quả thiết bị dạy học trong phân môn Tập viết lớp 3

11 300 10

Sáng kiến kinh nghiệm Tiểu học: Một số biện pháp nâng cao chất lượng hiệu quả phân môn Tập viết lớp 2

19 161 1

SKKN: Định hướng tư duy và phân tích bài toán thông qua một số bài tập hình học tọa độ trong mặt phẳng, nhằm nâng cao hiệu quả học tập chuyên đề phương pháp tọa độ trong mặt phẳng cho học sinh lớp 10 – Trường THPT Quảng Xương 4

24 267 11

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40876 2412

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24938 248

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24483 4281

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 20060 2846

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19492 1543

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19294 2967

Bảng biến đổi Laplace và biến đổi Z

1 19265 616

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 16161 2958

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 15976 330

Sự so sánh văn bản văn học và tác phẩm văn học

1 14577 133

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Lý thuyết chu kỳ và việc hỗ trợ sinh viên Gen Z trong học tập giữa bối cảnh chuyển đổi số

10 95 7 29-05-2024

Bài giảng môn Âm nhạc lớp 8 - Tiết 1: Học bài hát Mùa thu ngày khai trường

11 162 2 29-05-2024

Giáo trình Dược lý thú y (Nghề: Chăn nuôi thú y - Trình độ: Trung cấp) - Trường CĐ Kinh tế - Kỹ thuật Bạc Liêu

73 399 7 29-05-2024

Đề thi giữa học kì 1 môn Lịch sử và Địa lí lớp 6 năm 2023-2024 có đáp án - Trường THCS Ngô Sỹ Liên, Chương Mỹ

10 2 1 29-05-2024

Ebook Fundamentals of computer organization and architecture: Part 2

167 1 1 29-05-2024

The effects of seasonal variations on household water security and burden of diarrheal diseases among under 5 children in an urban community, Southwest Nigeria

10 66 1 29-05-2024

Sự hài lòng của khách hàng về thẻ tín dụng tại Ngân hàng TMCP Quân Đội

6 116 5 29-05-2024

Tứ giác điều hòa

10 468 3 29-05-2024

Bài giảng Hệ thống thông tin kế toán - Chương 2: Hệ thống thông tin kế toán doanh thu

43 818 1 29-05-2024

Khóa luận tốt nghiệp: Giải pháp phát triển hoạt động thanh toán quốc tế tại Agribank - Chi nhánh Sài Gòn

76 202 3 29-05-2024

Luận án Tiến sĩ Y học: Nghiên cứu đặc điểm lâm sàng, cận lâm sàng, vi khuẩn gây bệnh và biến đổi cytokine huyết thanh ở bệnh nhân viêm phổi cộng đồng nhập viện tại Hải Phòng

181 121 6 29-05-2024

Lí thuyết số (chuyên đề bồi dưỡng học sinh giỏi Toán THPT) - Trần Quang Thọ

33 109 2 29-05-2024

Đề thi vào lớp 10 môn Văn năm 2021 - 2022 có đáp án - Trường THPT chuyên tỉnh Hà Nam

9 86 1 29-05-2024

Đề thi học kì 2 môn Toán lớp 11 năm 2020-2021 - Trường THPT Nhân Chính

4 86 1 29-05-2024

Đề thi giữa học kì 2 môn Tiếng Anh lớp 11 năm 2020-2021 - Trường THPT Liễn Sơn

3 144 6 29-05-2024

Procalcitonin as a marker of Candida species detection by blood culture and polymerase chain reaction in septic patients

9 70 1 29-05-2024

Đề thi giữa học kì 1 môn Lịch sử lớp 10 năm 2023-2024 - Trường PT DTNT huyện Ia H'Drai

4 2 1 29-05-2024

Bài giảng Hội nhập kinh tế quốc tế - Chương 2: Lý thuyết về hội nhập kinh tế quốc tế

6 751 4 29-05-2024

Bài giảng Hệ thống sản xuất: Chương 1

44 2 1 29-05-2024

Khóa luận tốt nghiệp: Nghiên cứu các yếu tố ảnh hưởng đến quyết định mua bất động sản của khách hàng cá nhân tại Công ty cổ phần Apec Land Huế

123 317 2 29-05-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24938 248

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40876 2412

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 2774 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 5091 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3345 100

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6666 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5699 719

Quản trị khủng hoảng trong quan hệ công chúng

2 3134 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4461 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4747 189

Đã phát hiện trình chặn quảng cáo AdBlock

Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.