Khai thác luật phân lớp kết hợp theo tập dự đoán

Bài viết giới thiệu các thuật toán khai thác luật phân lớp kết hợp, đặc biệt là thuật toán PCAR đề xuất tỷ lệ dự đoán, được chọn ưu tiên hơn độ tin cậy, độ hỗ trợ để đánh giá luật, tạo ra bộ phân lớp chính xác hơn. Tuy nhiên, việc dự đoán đơn luật ưu tiên chọn tỷ lệ dự đoán dẫn đến việc dự đoán sai ở nhiều tập dữ liệu mất cân bằng về lớp. | TRƯỜNG ĐẠI HỌC SÀI GÒN SAIGON UNIVERSITY TẠP CHÍ KHOA HỌC SCIENTIFIC JOURNAL ĐẠI HỌC SÀI GÒN OF SAIGON UNIVERSITY Số 77 06 2021 No. 77 06 2021 Email tcdhsg@ Website http KHAI THÁC LUẬT PHÂN LỚP KẾT HỢP THEO TẬP DỰ ĐOÁN Mining class association rule based on predictive collection ThS. Nguyễn Anh Tú Trường Đại học Ngoại ngữ Tin học TÓM TẮT Bài viết giới thiệu các thuật toán khai thác luật phân lớp kết hợp đặc biệt là thuật toán PCAR đề xuất tỷ lệ dự đoán được chọn ưu tiên hơn độ tin cậy độ hỗ trợ để đánh giá luật tạo ra bộ phân lớp chính xác hơn. Tuy nhiên việc dự đoán đơn luật ưu tiên chọn tỷ lệ dự đoán dẫn đến việc dự đoán sai ở nhiều tập dữ liệu mất cân bằng về lớp. Do đó bài viết đề xuất thuật toán DPCAR để cải tiến giai đoạn dự đoán bằng cách ưu tiên chọn nhóm cao nhất về số luật phủ về trung bình điều hòa của tỷ lệ dự đoán và độ tin cậy và về độ hỗ trợ của luật trong bộ phân lớp. Kết quả thực nghiệm cho thấy thuật toán đề xuất đã tăng khoảng và khi so sánh với hai phiên bản của thuật toán PCAR cũng như vượt trội so với các thuật toán trước đó về độ chính xác trên 14 tập dữ liệu trong tập UCI. Từ khóa phân lớp luật phân lớp kết hợp tập dự đoán khai thác dữ liệu ABSTRACT This paper will present the algorithms for mining the class association rule especially an algorithm named PCAR that has proposed a novel measure known as the predictive rate which has priority over confidence support etc. in the rule evaluation has built the classifier with high accuracy. However by using single accurate rule prediction many cases were incorrectly covered by the rule which higher predictive rate especially in imbalanced real datasets. Therefore this paper proposes the DPCAR algorithm to improve PCAR algorithm at the prediction phase by selecting the class with priority dominant class groups the highest harmonic mean ratio between predictive rate and confidence and the highest support of rule in the classifier. The experimental results .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.