Tối ưu mô hình phân lớp dữ liệu dựa trên thuật toán K Nearest Neighbor

Bài viết trình bày giải pháp xác định tham số k tốt nhất, nhằm tối ưu mô hình phân loại dữ liệu dựa trên thuật toán K Nearest Neighbor. Thuật toán K Nearest Neighbor là một trong các thuật toán được đánh giá đơn giản, hiệu quả và được sử dụng rộng rãi trong lĩnh vực học máy. | Nguyễn Thanh Trần Đình Sơn 227 Tối Ưu Mô Hình Phân Lớp Dữ Liệu Dựa Trên Thuật Toán K Nearest Neighbor Nguyễn Thanh1 và Trần Đình Sơn2 1 2 Trường Đại học Công nghệ Thông tin và Truyền thông Việt-Hàn Đà Nẵng Việt Nam thanhn tdson @ Tóm tắt. Trong những năm gần đây việc sử dụng trí tuệ nhân tạo để xử lý dữ liệu lớn là rất phổ biến. Các mô hình xử lý dữ liệu được xây dựng dựa trên các thuật toán học máy để giải quyết các bài toán cụ thể đã được phát triển rộng rãi. Thuật toán K Nearest Neighbor là một trong các thuật toán được đánh giá đơn giản hiệu quả và được sử dụng rộng rãi trong lĩnh vực học máy. Nó có thể thực hiện trên cả dữ liệu có cấu trúc hoặc không có cấu trúc nhằm phân loại dữ liệu và xây dựng các mô hình dự báo nhận dạng vv. Tuy nhiên kết quả của mô hình phụ thuộc rất lớn vào việc chọn tham số k số láng giềng gần nhất . Trong bài báo này chúng tôi trình bày giải pháp xác định tham số k tốt nhất nhằm tối ưu mô hình phân loại dữ liệu dựa trên thuật toán K Nearest Neighbor. Từ khóa Học máy khai phá dữ liệu phân lớp K Nearest Neighbor mô hình tối ưu. Abstract. In recent years the artificial intelligence it s very common to use to process big data. Data processing models built on machine learning algorithms to solve specific problems have been widely developed. The K Nearest Neighbor algorithm is one of the simplest effective and widely used algo- rithms in machine learning field. It can be performed on both structured or unstructured data in order to classify the data and build predictive identity etc. models. large on the selection of parameter k number of nearest neighbors . In this paper we present the best solution to determine the parameter k to optimize the data classification model based on the K Nearest Neighbor algorithm. Keywords Machine learning Data mining Classification K Nearest Neighbor Modeling Optimiza- tion. 1 Giới thiệu Khai thác dữ liệu được xem là một công nghệ tạo nên sự đột phá mang tính cách mạng trong lĩnh vực thông tin. .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.