Một thuật toán hiệu quả để khai thác tập hữu ích trung bình cao

Bài viết Một thuật toán hiệu quả để khai thác tập hữu ích trung bình cao đề xuất thuật toán HAU-Miner để khai thác tập hữu ích trung bình cao một cách tốt hơn. Kết quả thực nghiệm trên hai nhóm cơ sở dữ liệu dày và thưa cho thấy thuật toán HAU-Miner có hiệu suất thực thi cao hơn thuật toán MHAI về số lượng ứng viên phát sinh, thời gian thực thi và bộ nhớ sử dụng. | Phạm Tuấn Khiêm Nguyễn Văn Lễ MỘT THUẬT TOÁN HIỆU QUẢ ĐỂ KHAI THÁC TẬP HỮU ÍCH TRUNG BÌNH CAO Phạm Tuấn Khiêm Nguyễn Văn Lễ Khoa Công nghệ thông tin Trường Đại học Công nghiệp Thực phẩm TPHCM Tóm tắt Khai thác tập hữu ích trung bình cao High chúng không nhỏ hơn ngưỡng độ hữu ích tối thiểu được Average Utility Itemset - HAUI đã được nghiên cứu xác định bởi người dùng. Một số thuật toán được đề xuất rộng rãi nhằm khắc phục những hạn chế của tập hữu ích để khai thác tập mặt hàng theo cách tiếp cận này như cao High Utility Itemset - HUI trong việc đánh giá kết HUI-Miner 5 FHM 8 HUP-Miner 9 . quả của người dùng. Tập hữu ích trung bình cao thể hiện các tập mặt hàng có độ hữu ích cao thật sự. Trong đó yếu Việc khai thác tập hữu ích cao có thể xuất hiện nhiều tố chiều dài của tập mặt hàng được xem xét điều này đã tập mặt hàng có số phần tử lớn là tập hữu ích cao trong loại bỏ được những tập hữu ích cao có chứa nhiều mặt đó chỉ có một số mặt hàng có ý nghĩa thực tế về độ hữu hàng kém ý nghĩa trong kết quả phân tích kinh doanh. ích cao trong khi các mặt hàng khác trong tập có độ hữu Gần đây nhiều thuật toán đã được đề xuất để khai thác ích thấp nên không có ý nghĩa trong thực tế. Điều này có tâp hữu ích trung bình cao tuy nhiên hiệu suất thực thi thể gây khó khăn trong việc phân tích kinh doanh từ tập vẫn chưa hiệu quả. Trong bài báo này chúng tôi đề xuất kết quả. Ví dụ tập mặt hàng gồm năm sản phẩm A B C thuật toán HAU-Miner để khai thác tập hữu ích trung D E là tập hữu ích cao do độ hữu ích lớn hơn giá trị bình cao một cách tốt hơn. Kết quả thực nghiệm trên hai ngưỡng cho trước. Nhưng thực tế hai phẩm A và B có độ nhóm cơ sở dữ liệu dày và thưa cho thấy thuật toán hữu ích cao quyết định độ hữu ích cao cho cả tập các sản HAU-Miner có hiệu suất thực thi cao hơn thuật toán phẩm C D và E có độ hữu ích thấp. Do đó việc phân tích kết quả trên tập con A B mới thực sự có ý nghĩa thay vì MHAI về số lượng ứng viên phát sinh thời gian thực thi và bộ nhớ sử dụng. phân tích trên tập .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
119    286    1    30-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.