Tóm tắt Luận văn Thạc sĩ: Nghiên cứu phân lớp trên dữ liệu mất cân bằng và ứng dụng

Kết cấu nội dung của Luận văn này gồm 3 chương: Chương 1 - Khảo sát tổng quan về phân lớp dữ liệu, học máy và các vấn đề liên quan; Chương 2 - Chương này nghiên cứu một số thuật toán để giải quyết bài toán phân lớp dữ liệu mất cân bằng; Chương 3 - Thử nghiệm phân lớp dữ liệu mất cân bằng dựa trên các thuật toán đã nghiên cứu trong chương 2. Mời các bạn cùng tham khảo! | HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - NGUYỄN MINH HÀ NGHIÊN CỨU PHÂN LỚP TRÊN DỮ LIỆU MẤT CÂN BẰNG VÀ ỨNG DỤNG Chuyên ngành KHOA HỌC MÁY TÍNH Mã số TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2020 Luận văn được hoàn thành tại HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học Tiến sĩ VŨ VĂN THỎA Phản biện 1 Phản biện 2 Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông Vào lúc . giờ . ngày . tháng . . năm . Có thể tìm hiểu luận văn tại - Thư viện của Học viện Công nghệ Bưu chính Viễn thông. 1 PHẦN MỞ ĐẦU Trong những năm gần đây vấn đề học máy từ dữ liệu phân bố không cân bằng là một thách thức lớn cho các nhà nghiên cứu trong rất nhiều miền ứng dụng thực tế mạng internet bảo mật viễn thông quản lý tài chính và tin sinh học Việc phân tích và hiểu được dữ liệu thô là mục đích của các hệ thống xử lý hỗ trợ ra quyết định ngày càng đóng vai trò quan trọng và trở nên cần thiết. Chúng được áp dụng và đã đạt được nhiều thành công to lớn trong nhiều ứng dụng của cuộc sống như khai phá tri thức kỹ thuật xử lý dữ liệu và nhiều ứng dụng khác. Tuy nhiên những năm gần đây với sự xuất hiện của dữ liệu phân bố mất cân bằng đang trở thành nguyên nhân gây ra nhiều khó khăn ảnh hưởng đến các thuật toán học máy chuẩn những thuật toán được thiết kế và áp dụng vào ứng dụng của dữ liệu phân bố cân bằng. Khi những thuật toán chuẩn này được áp dụng vào dữ liệu mất cân bằng chúng xử lý dữ liệu lệch lạc dẫn đến không đạt được độ chính xác cao giữa các lớp của dữ liệu. Thêm vào đó vấn đề phân bố dữ liệu mất cân bằng đang ngày càng trở nên quan trọng trong thực tế với lượng lớn các ứng dụng. Khi áp dụng các thuật toán phân lớp truyền thống lên các tập dữ liệu mất cân bằng đa số các phần tử thuộc lớp đa số sẽ được phân lớp đúng và các phần tử thuộc lớp thiểu số cũng sẽ được gán nhãn lớp là nhãn lớp của lớp đa số. Điều này dẫn đến kết quả là độ chính xác accuracy của việc phân lớp có thể rất cao trong khi giá trị độ nhạy .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.