Nghiên cứu các kỹ thuật lựa chọn đặc trưng trong tập dữ liệu

Bài viết tập trung nghiên cứu và tổng hợp các phương pháp được sử dụng trong việc lựa chọn các đặc tính bao gồm Filter, Wrapper và Embedded với các phương thức, thuật toán được sử dụng. Từ đó, tổng hợp và đánh giá các ưu nhược điểm của từng phương pháp. | 204 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2020 CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC Nghiên cứu các kỹ thuật lựa chọn đặc trưng trong tập dữ liệu Hà Thị Minh Phương1 Phan Thị Quỳnh Hương2 1 2 Trường ĐH Công nghệ Thông tin và Truyền thông Việt-Hàn Đại học Đà Nẵng htmphuong ptqhuong @ Tóm tắt. Sự phát triển mạnh mẽ về số lượng và tính phức tạp của dữ liệu của các ứng dụng đã dẫn đến những thách thức trong việc khai thác dữ liệu và sử dụng các mô hình học máy. Một trong những thách thức lớn là việc lựa chọn các đặc tính có liên quan từ tập hợp các đặc tính có sẵn ban đầu để cải thiện tối đa hiệu suất học tập hơn của dữ liệu gốc. Vì vậy việc lựa chọn các đặc tính được trở thành tiếp cận các nhà nghiên cứu tập trung trong những năm gần đây. Lựa chọn đặc tính cung cấp giải pháp hiệu quả để giải quyết vấn đề này bằng cách loại bỏ dữ liệu không liên quan và dư thừa có thể giảm thời gian tính toán cải thiện độ chính xác của mô hình máy học. Trong bài báo này chúng tôi tập trung nghiên cứu và tổng hợp các phương pháp được sử dụng trong việc lựa chọn các đặc tính bao gồm Filter Wrapper và Embedded với các phương thức thuật toán được sử dụng. Từ đó tổng hợp và đánh giá các ưu nhược điểm của từng phương pháp. Từ khóa lựa chọn đặc tính filter wrapper embedded hybrid. Abstract. The rapid growth in quantity and complexity of data of applications has led to challenges in data mining and the use of machine learning models. One of the major challenges is the selection of relevant features from the original set of features to maximize the learning performance of the original data. Thus the selection of features is becoming an approach to focus researchers in recent years. Feature selection provides an effective solution to this problem by eliminating extraneous and redundant data which can reduce computation time improve the accuracy of the machine learning model. In this paper we focus on research and synthesis of the methods used in the selection of properties including .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.