Khai thác k mẫu tuần tự tối đại sử dụng cây dữ liệu chiếu tiền tố

Khai thác mẫu tuần tự là một nhiệm vụ quan trọng của khai thác dữ liệu đã và đang được nghiên cứu rộng rãi. Cho một tập các chuỗi, trong đó mỗi chuỗi bao gồm một danh sách các tập phổ biến và một ngưỡng hỗ trợ tối thiểu do người dùng chỉ định (minsup), khai thác mẫu tuần tự là tìm ra tất cả các mẫu phổ biến có độ hỗ trợ không thấp hơn minsup. | Khai thác k mẫu tuần tự tối đại sử dụng cây dữ liệu chiếu tiền tố Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 Khai thác k mẫu tuần tự tối đại sử dụng cây dữ liệu chiếu tiền tố Mining Top-k Maximal Sequential Patterns using Prefix-Projected Database Tree Lê Hoài Bắc, Nguyễn Thị Quyên Abstract: This paper propose a method called để giảm chi phí lưu trữ dữ liệu, xuất phát từ tập mẫu TMSP to perform squential patten mining. Because tuần tự độ dài là 1, PrefixSpan tạo ra CSDL được maximal patterns compact representations of frequent chiếu với mỗi mẫu đó. Trong CSDL chiếu, mỗi chuỗi patterns, so they are used for mining in TMSP. The dữ liệu chỉ giữ lại phần hậu tố đối với tiền tố đã chiếu. main idea of TMSP is mining top-k frequent maximal Mẫu được phát triển bằng những item phổ biến tìm equential patterns of length no less than the minimum được trong CSDL được chiếu. Quá trình này được lặp length of each pattern (min_l) and no greater than the lại cho đến khi CSDL chiếu không còn item phổ biến maximum length of each pattern (max_l) with k is the nào. Thuật toán SPADE [2] tổ chức dữ liệu theo chiều desired number of maximal sequential patterns to be dọc, ứng với mỗi item sẽ lưu danh sách định danh của mined. The proposed method helps user do not need các chuỗi dữ liệu và định danh của các itemset có chứa turning specification of a minimum support threshold item đó. Độ hỗ trợ của item được tính trực tiếp từ danh to perform the mining which is a disadvantage of sách các định danh. Mặt khác, SPADE còn dựa trên lý previous studies. Experimental results on real datasets thuyết dàn để chia nhỏ không gian tìm kiếm và thao show that TMSP serves as an efficient solution for tác kết đơn giản để tạo ra tập ứng viên. Thuật toán này mining sequential patterns. The reults also gom nhóm các mẫu tuần tự dựa theo tiền tố thành các demonstrate that TMSP is better than the maximal lớp tương .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.