COOC CFI: Thuật toán hiệu quả khai thác tập phổ biến đóng trên dữ liệu giao dịch

Bài viết COOC CFI: Thuật toán hiệu quả khai thác tập phổ biến đóng trên dữ liệu giao dịch trình bày khai thác luật kết hợp là một trong những kỹ thuật quan trọng và được nghiên cứu nhiều trong khai thác dữ liệu. Khai thác tập phổ biến đóng là một trong những vấn đề cơ bản trong khai thác luật kết hợp. Hầu hết các thuật toán sinh không gian tìm kiếm dựa trên tập mục thỏa ngưỡng phổ biến tối thiểu và không dùng lại cho lần khai thác tiếp theo,. . | TẠP CHÍ KHOA HỌC YERSIN COOC-CFI: THUẬT TOÁN HIỆU QUẢ KHAI THÁC TẬP PHỔ BIẾN ĐÓNG TRÊN DỮ LIỆU GIAO DỊCH Phan Thành Huấn* TÓM TẮT Title: Cooc-cfi: An efficient mining algorithm for closed frequent itemsets in transaction databases Từ khóa: Từ khóa: Luật kết hợp, tập phổ biến đóng, tập mục đồng xuất hiện. Keywords: Association rule, closed frequent itemsets, cooccurrence itemset. Thông tin chung: Ngày nhận bài: 29/9/2016; Ngày nhận kết quả bình duyệt: 13/3/2017; Ngày chấp nhận đăng bài: 06/9/2017. Tác giả: ThS., Đại học Khoa học Xã hội và Nhân văn, Đại học Quốc gia Tp. Hồ Chí Minh huanphan@ Khai thác luật kết hợp là một trong những kỹ thuật quan trọng và được nghiên cứu nhiều trong khai thác dữ liệu. Khai thác tập phổ biến đóng là một trong những vấn đề cơ bản trong khai thác luật kết hợp. Hầu hết các thuật toán sinh không gian tìm kiếm dựa trên tập mục thỏa ngưỡng phổ biến tối thiểu và không dùng lại cho lần khai thác tiếp theo. Để khắc phục vấn đề này, chúng tôi đề xuất một cách tiếp cận mới để tìm tập phổ biến đóng trên dữ liệu giao dịch dùng cấu trúc dữ liệu lưu trữ dạng bit và tập chỉ mục chứa tập mục đồng xuất hiện để chiếu tính nhanh tập phổ biến đóng. Sau cùng, chúng tôi trình bày kết quả thực nghiệm, cho thấy thuật toán đề xuất tốt hơn so với các thuật toán hiện hành. ABSTRACT Association rule mining is one of the most important and wellresearched techniques of Data Mining. Mining closed frequent itemsets is one of the most fundamental problems in association rule mining. Most of algorithms in literature used to find frequent itemsets on search space items, which have a support greater than minsup and not reuse for mining next time. To overcome this problem, we propose a new approach to fast dectect closed frequent itemsets using data structure on bit and array cooccurrence itemset of kernel item for fast mining closed frequent itemsets. Finally, the result showed the proposed algorithm which was better than the existing algorithms. 1. Giới

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
83    4    1    01-06-2024
50    671    1    01-06-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.