Một mô hình hiệu quả khai phá tập mục lợi ích cao

Khai phá tập phổ biến từ cơ sở dữ liệu giao dịch là một trong các kỹ thuật khai phá dữ liệu và có rất nhiều ứng dụng trong kinh doanh, y tế, giáo dục, . Bài viết trình bày vấn đề liên quan đến khai phá tập lợi ích cao; Mô hình CWU; Đề xuất thuật toán khai phá tập lợi ích cao sử dụng mô hình CWU; Kết quả đạt được và so sánh với các thuật toán khác. | Các công trình nghiên cứu phát triển và ứng dụng CNTT-TT Tập V-1 Số 13 33 tháng 6 2015 Một mô hình hiệu quả khai phá tập mục lợi ích cao An Efficient Model for Mining High Utility Itemsets Đậu Hải Phong Nguyễn Mạnh Hùng Abstract Today high utility itemsets mining is an lợi ích trong giao dịch và lợi ích ngoài của phần tử important research issue in data mining because it đó. Ví dụ lợi ích trong từng giao dịch như số lượng considers the profit and quantity of items in each của mặt hàng trong mỗi lần mua hàng lợi ích ngoài transaction. Most high utility itemsets algorithms such như giá trị lợi nhuận của từng mặt hàng đó đem lại. as UP-Growth 9 Udepth 5 Two-Phase 3 PB Một tập có lợi ích cao khi giá trị lợi ích của nó không Projection-Based 8 ect. use TWU model nhỏ hơn một ngưỡng lợi ích tối thiểu cho trước. Transaction Weight Utility for pruning candidates. Một vấn đề khó khăn trong khai phá tập lợi ích cao However the number of candidate itemsets generated là các tập lợi ích không có tính chất đóng 2 . Tính in these algorithms is enormous. In this paper we chất này đảm bảo một tập là tập lợi ích cao thì các tập propose a new candidate weight utility model CWU con của nó cũng là tập lợi ích cao. Do vậy số lượng and HP High Projection algorithm base on CWU to các ứng cử viên được sinh ra rất lớn và chi phí lớn về reduce the number of candidate itemsets. The thời gian duyệt dữ liệu nhiều lần để kiểm tra các ứng experimental results show that the performance and viên như trong một số thuật toán 3-5 . Để tránh duyệt number candidate of our algorithm is better than Two- dữ liệu nhiều lần thì một số thuật toán dùng cấu trúc Phase 3 PB 8 . cây để tìm tập lợi ích cao như 6 9 10 . Nhưng các Keywords Data Mining Frequent Itemsets High thuật toán này tiêu tốn nhiều thời gian và không gian Utility Candidate Weight Utility HP algorithm. bộ nhớ để sinh ra các cây điều kiện của từng tiền tố. Trong 7 Liu đã trình bày mô hình TWU khai phá I. GIỚI THIỆU tập lợi ích cao để loại bớt tập

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.