Mục tiêu của Luận văn là nghiên cứu các kỹ thuật học máy để giải quyết bài toán phân lớp dữ liệu nói chung và thử nghiệm đánh giá hiệu năng của chúng trên bộ dữ liệu KDD cup 99. Mời các bạn cùng tham khảo! | HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - ĐỖ THỊ LƯƠNG NGHIÊN CỨU MỘT SỐ THUẬT TOÁN HỌC MÁY ĐỂ PHÂN LỚP DỮ LIỆU VÀ THỬ NGHIỆM Chuyên ngành Hệ Thống thông tin Mã số TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - NĂM 2019 Luận văn được hoàn thành tại HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học Tiến sỹ Vũ Văn Thỏa Phản biện 1 . Phản biện 2 . Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông Vào lúc . giờ . ngày . tháng . năm . Có thể tìm hiểu luận văn tại - Thư viện của Học viện Công nghệ Bưu chính Viễn thông 1 MỞ ĐẦU Trong thời gian gần đây sự phát triển mạnh mẽ của công nghệ thông tin và các dịch vụ liên quan đã làm số lượng thông tin được trao đổi trên mạng Internet tăng một cách đáng kể. Số lượng thông tin được lưu trữ trong các kho dữ liệu cũng tăng với một tốc độ chóng mặt. Đồng thời tốc độ thay đổi thông tin là cực kỳ nhanh chóng. Theo thống kê của Broder et al 2003 cứ sau 9 tháng hoặc 12 tháng lượng thông tin được lưu trữ tìm kiếm và quản lý lại tăng gấp đôi. Hiện nay loài người đang bước vào kỷ nguyên IoT Internet of Things Internet kết nối vạn vật . Thông qua internet người dùng có nhiều cơ hội để tiếp xúc với nguồn thông tin vô cùng lớn. Tuy nhiên cùng với nguồn thông tin vô tận đó người dùng cũng đang phải đối mặt với sự quá tải thông tin. Đôi khi để tìm được các thông tin cần thiết người dùng phải chi phí một lượng thời gian khá lớn. Với số lượng thông tin đồ sộ như vậy một yêu cầu cấp thiết đặt ra là làm sao tổ chức tìm kiếm và khai thác thông tin dữ liệu một cách hiệu quả nhất. Một trong các giải pháp được nghiên cứu để giải quyết vấn đề trên là xây dựng các mô hình tính toán dựa trên các phương pháp học máy nhằm phân loại khai thác thông tin một cách tự động và trích xuất các tri thức hữu ích. Trong đó bài toán phân lớp Classification dữ liệu có ý nghĩa hết sức quan trọng. Phân lớp dữ liệu là việc xếp các dữ liệu vào những lớp đã biết trước. Ví dụ Phân lớp sinh viên theo kết quả