Nghiên cứu các kỹ thuật lựa chọn đặc trưng trong tập dữ liệu

Bài viết tập trung nghiên cứu và tổng hợp các phương pháp được sử dụng trong việc lựa chọn các đặc tính bao gồm Filter, Wrapper và Embedded với các phương thức, thuật toán được sử dụng. Từ đó, tổng hợp và đánh giá các ưu nhược điểm của từng phương pháp. | 204 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2020 CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC Nghiên cứu các kỹ thuật lựa chọn đặc trưng trong tập dữ liệu Hà Thị Minh Phương1 Phan Thị Quỳnh Hương2 1 2 Trường ĐH Công nghệ Thông tin và Truyền thông Việt-Hàn Đại học Đà Nẵng htmphuong ptqhuong @ Tóm tắt. Sự phát triển mạnh mẽ về số lượng và tính phức tạp của dữ liệu của các ứng dụng đã dẫn đến những thách thức trong việc khai thác dữ liệu và sử dụng các mô hình học máy. Một trong những thách thức lớn là việc lựa chọn các đặc tính có liên quan từ tập hợp các đặc tính có sẵn ban đầu để cải thiện tối đa hiệu suất học tập hơn của dữ liệu gốc. Vì vậy việc lựa chọn các đặc tính được trở thành tiếp cận các nhà nghiên cứu tập trung trong những năm gần đây. Lựa chọn đặc tính cung cấp giải pháp hiệu quả để giải quyết vấn đề này bằng cách loại bỏ dữ liệu không liên quan và dư thừa có thể giảm thời gian tính toán cải thiện độ chính xác của mô hình máy học. Trong bài báo này chúng tôi tập trung nghiên cứu và tổng hợp các phương pháp được sử dụng trong việc lựa chọn các đặc tính bao gồm Filter Wrapper và Embedded với các phương thức thuật toán được sử dụng. Từ đó tổng hợp và đánh giá các ưu nhược điểm của từng phương pháp. Từ khóa lựa chọn đặc tính filter wrapper embedded hybrid. Abstract. The rapid growth in quantity and complexity of data of applications has led to challenges in data mining and the use of machine learning models. One of the major challenges is the selection of relevant features from the original set of features to maximize the learning performance of the original data. Thus the selection of features is becoming an approach to focus researchers in recent years. Feature selection provides an effective solution to this problem by eliminating extraneous and redundant data which can reduce computation time improve the accuracy of the machine learning model. In this paper we focus on research and synthesis of the methods used in the selection of properties including .

Tường Lĩnh 82 7 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

Nhận dạng Payload độc với hướng tiếp cận tập mô hình máy học

11 102 1

Thiết kế và chế tạo mô hình máy phay CNC 3 trục

12 479 37

Mô phỏng dữ liệu dòng chảy bằng mô hình chi tiết hóa động lực kết hợp với thuật toán học máy: Áp dụng cho lưu vực sông Sài Gòn - Đồng Nai

9 289 3

Luận văn Thạc sĩ Khoa học máy tính: Mô hình 3d và một số kỹ thuật mô hình hóa 3D trong mô phỏng

71 121 3

Luận văn Thạc sĩ Khoa học máy tính: Nghiên cứu một số kỹ thuật hiện thị mô hình 3D và ứng dụng hiện thị mô hình 3D di tích Patuxay

64 117 2

Ứng dụng mô hình Burckhardt để mô tả toán học đặc tính thực nghiệm của bánh xe máy kéo nông nghiệp

6 76 1

Xây dựng mô hình động lực học quay vòng của máy kéo hai thân nối khớp bản lề

7 67 1

Nghiên cứu phát triển mô hình toán học mô phỏng chuyển động tàu thủy

5 473 9

Nhân rộng mô hình hầm Biogas cải tiến và sử dụng khí sinh học vận hành máy phát điện tại huyện Lập Thạch

3 310 7

Ứng dụng của học máy trong lĩnh vực dự báo: So sánh hiệu quả của mô hình dự báo truyền thống arima và mô hình dự báo sử dụng mạng nơ ron nnar

5 150 4

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40936 2412

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24964 248

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24532 4282

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 20097 2847

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19513 1549

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19331 2967

Bảng biến đổi Laplace và biến đổi Z

1 19307 618

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 16184 2958

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 16025 330

Sự so sánh văn bản văn học và tác phẩm văn học

1 14637 133

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Nghiên cứu tác dụng của dung dịch điện giải ion kiềm ECO G9 lên chỉ số lipid máu và acid uric máu trên mô hình động vật thực nghiệm

11 77 1 06-06-2024

Luận văn Thạc sĩ Kế toán: Kiểm soát nội bộ hoạt động tín dụng khách hàng doanh nghiệp tại Ngân hàng Nông nghiệp và Phát triển Nông thôn - chi nhánh Bắc Quảng Bình

117 58 1 06-06-2024

Giáo án Hóa học lớp 10 - Tiết 42: Sơ lược về hợp chất có oxi của clo

9 200 2 06-06-2024

Chuyển đơn phôi nang: Giải pháp hiệu quả để giảm thiểu nguy cơ đa thai ở bệnh nhân dưới 35 tuổi

4 82 1 06-06-2024

Đề thi giữa học kì 2 môn Sinh học lớp 9 năm 2023-2024 có đáp án - Trường THCS Nguyễn Huệ, Bắc Trà My

17 6 1 06-06-2024

Does firm characteristics affect foreign investors’ transactions the evidence from the Vietnam stock market

10 187 1 06-06-2024

Lecture Object-Oriented programming - Lesson 4: Concepts related with Inheritance

26 364 1 06-06-2024

Việc làm và thu nhập của người lao động trong doanh nghiệp FDI ở Việt Nam

11 94 2 06-06-2024

Khóa luận tốt nghiệp ngành Luật: Tổ chức quản lý Công ty cổ phần theo Pháp luật Việt Nam

67 174 4 06-06-2024

Kết quả phẫu thuật xâm lấn tối thiểu hàn xương liên thân đốt qua lỗ liên hợp điều trị hẹp ống sống thắt lưng mất vững tại Bệnh viện Trung ương Thái Nguyên

6 188 1 06-06-2024

Factors affecting the capacity of human resources in higher education institutions of the ministry of finance of Vietnam - A case study of the university of finance - business administration

11 8 1 06-06-2024

Đánh giá đột biến gen BRCA1, BRCA2 trên bệnh nhân ung thư vú có nguy cơ cao tại Bệnh viện K

6 65 1 06-06-2024

Effects of colloid pre-loading on thromboelastography during elective intracranial tumor surgery in pediatric patients: Hydroxyethyl starch 130/0.4 versus 5% human albumin

7 110 1 06-06-2024

Các yếu tố sinh thái ảnh hưởng đến sự phát triển của loài móng tay ở Vườn Quốc gia Xuân Thủy

5 251 1 06-06-2024

Giáo trình Tiện ren tam giác (Nghề: Cắt gọt kim loại - Cao đẳng) - Trường Cao đẳng Cơ điện Xây dựng Việt Xô

63 275 6 06-06-2024

Phan Huy Ích trong tiến trình nhà Thanh công nhận triều Nguyễn

36 76 1 06-06-2024

Giáo án môn Toán lớp 3 sách Chân trời sáng tạo - Tuần 28: So sánh các số có năm chữ số (Tiết 2)

3 342 3 06-06-2024

Luận văn Thạc sĩ Luật học: Quyền sử dụng hạn chế bất động sản liền kề theo pháp luật Việt Nam hiện nay

102 93 2 06-06-2024

Luận văn Thạc sĩ Quản trị kinh doanh: Phát triển nguồn nhân lực tại Ngân hàng TMCP Công thương Bắc Đà Nẵng

109 66 3 06-06-2024

Sáng kiến kinh nghiệm THPT: Vận dụng phương pháp dạy học theo trạm trong dạy học chủ đề: hoán vị-chỉnh hợp-tổ hợp, Đại số và Giải tích 11 THPT

50 273 12 06-06-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24964 248

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40936 2412

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 2801 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 5116 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3364 100

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6681 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5724 720

Quản trị khủng hoảng trong quan hệ công chúng

2 3159 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4488 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4773 189