Bài báo đề xuất một phương pháp học máy cho giải thuật phân lớp này nhằm tăng hiệu quả phân lớp của thuật toán. Cách tiếp cận này về cơ bản đã làm tăng khả năng phân lớp của giải thuật RF, phương pháp đề xuất còn cho thấy khả năng phân lớp tốt hơn một số phương pháp trích chọn đã được công bố. Như vậy, hướng cải tiến mà bài báo đề xuất là có khả thi và thu được kết quả tương đối cao. Mời các bạn cùng tham khảo! | Hội Thảo Quốc Gia 2015 về Điện Tử Truyền Thông và Công Nghệ Thông Tin ECIT 2015 Hội Thảo Quốc Gia 2015 về Điện Tử Truyền Thông và Công Nghệ Thông Tin ECIT 2015 Một phương pháp trích trọn thuộc tính hiệu quả cho dữ liệu có số chiều lớn Hà Văn Sang1 Đồng Thị Ngọc Lan1 và Ngô Thị Thu Trang2 1 Khoa Hệ thống thông tin Kinh tế Học Viện Tài chính Viễn thông Học viện Công nghệ Bưu chính Viễn thông 2 Khoa Email sanghv@ landn0101@ trangntt1@ Abstract Phân lớp là một trong những bài toán cơ bản trong pháp này có ảnh hưởng ngay lập tức đến các ứng dụng như khai phá tri thức và dữ liệu. Một thách thức của bài toán phân tăng tốc độ của các thuật toán khai phá dữ liệu cải thiệu chất lớp là số lượng thuộc tính thường rất lớn việc phân lớp sao cho lượng dữ liệu và vì vậy tăng hiệu suất khai phá dữ liệu kiểm chính xác và hiệu quả hiện vẫn là một nghiên cứu thú vị cho các soát được các kết quả của thuật toán. nhà khoa học trong lĩnh vực khoa học máy tính. Bài báo đi sâu vào nghiên cứu giải thuật phân lớp thuộc tính random forest Trong bài báo này chúng tôi sẽ trình bày một đề xuất mới RF . Đây là một giải thuật đã được nhiều nghiên cứu chứng để dựa vào đó xây dựng mô hình trích chọn đặc trưng tối ưu minh là rất hiệu quả trong phân lớp thuộc tính đối với bộ dữ liệu giúp giảm kích cỡ của dữ liệu theo hướng chỉ giữ lại các thuộc có số lượng thuộc tính lớn. Trên cơ sở đó bài báo đề xuất một tính đặc trưng loại bỏ những thuộc tính không liên quan và phương pháp học máy cho giải thuật phân lớp này nhằm tăng những thuộc tính nhiễu nhằm tăng tốc độ các thuật toán phân hiệu quả phân lớp của thuật toán. Cách tiếp cận này về cơ bản đã lớp cải thiện chất lượng dữ liệu và vì vậy sẽ tăng hiệu suất của làm tăng khả năng phân lớp của giải thuật RF phương pháp đề việc khai phá dữ liệu. Cụ thể phương pháp đề xuất sẽ chọn ra xuất còn cho thấy khả năng phân lớp tốt hơn một số phương những thuộc tính tốt nhất để làm tăng năng suất của thuật toán pháp trích chọn đã được công