Khai thác tập hữu ích cao tương quan với ràng buộc chiều dài

Vấn đề khai thác tập hữu ích cao tương quan (Correlated Hight Utility Itemset - CoHUI) trong cơ sở dữ liệu giao dịch đã có nhiều nghiên cứu được đề xuất nhằm trích xuất tri thức từ hành vi mua hàng của người dùng. Bài viết đề xuất thuật toán CHL (Correlated High Utility Itemset with Length constraint) để khai thác tập hữu ích cao tương quan trên cơ sở dữ liệu giao dịch với ràng buộc chiều dài. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR TP. HCM ngày 23-24 12 2021 DOI KHAI THÁC TẬP HỮU ÍCH CAO TƯƠNG QUAN VỚI RÀNG BUỘC CHIỀU DÀI Nguyễn Văn Lễ1 Trần Văn Thọ1 Phạm Tuấn Khiêm1 Nguyễn Văn Hoàng2 1 Trường Đại học Công nghiệp thực phẩm TP. Hồ Chí Minh 2 Trường Đại học Văn Lang lenv@ thotv@ khiempt@ TÓM TẮT Vấn đề khai thác tập hữu ích cao tương quan Correlated Hight Utility Itemset - CoHUI trong cơ sở dữ liệu giao dịch đã có nhiều nghiên cứu được đề xuất nhằm trích xuất tri thức từ hành vi mua hàng của người dùng. Tuy nhiên kết quả khai thác được có nhiều tập với số lượng mặt hàng lớn sẽ gây khó khăn cho việc phân tích và quyết định trong kinh doanh thay vì xem xét trên các tập kết quả với số lượng mặt hàng ít hơn. Do đó ràng buộc chiều dài được bổ sung trong quá trình khai thác nhưng mới chỉ dừng lại trong việc khai thác tập hữu ích cao mà chưa xem xét cho việc khai thác tập hữu ích cao có tương quan. Trong bài báo này chúng tôi đề xuất thuật toán CHL Correlated High Utility Itemset with Length constraint để khai thác tập hữu ích cao tương quan trên cơ sở dữ liệu giao dịch với ràng buộc chiều dài. Kết quả thử nghiệm trên các cơ sở dữ liệu Chess Mushroom Accident Kosarak Retail Chainstore cho thấy thuật toán CHL có hiệu suất thực thi hiệu quả hơn so với thuật toán so sánh CoUPM về thời gian thực thi và bộ nhớ sử dụng đặc biệt là các cơ sở dữ liệu thưa. Từ khóa Tập hữu ích cao tính tương quan ràng buộc chiều dài tập hữu ích cao có tương quan khai thác dữ liệu. I. GIỚI THIỆU Khai thác các tập hữu ích cao High Utility Itemsets - HUI trên cơ sở dữ liệu giao dịch là bài toán phổ biến và có nhiều ứng dụng trong thực tế. Các thuật toán khai thác tập hữu ích cao đề cập đến việc khám phá các tập mặt hàng có độ hữu ích cao so với ngưỡng độ hữu ích cho trước. Một số thuật toán điển hình về khai thác tập hữu ích cao như UP-Grown 1 Two-Phase 2

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.