Nâng cao hiệu năng cho thuật toán khai thác tập hiếm tối thiểu trên bộ xử lý đa nhân

Bài viết đề xuất thuật toán song song MCP-mRI nhằm nâng cao hiệu năng cho khai thác tập hiếm tối thiểu trên bộ xử lý đa nhân. Thuật toán đề xuất dễ dàng mở rộng trên nhiều hệ thống tính toán phân tán như Hadoop, Apache Spark. Kết quả thực nghiệm trên bộ dữ liệu thực của UCI và bộ dữ liệu giả lập của trung tâm nghiên cứu IBM Almaden, cho thấy thuật toán đề xuất hiệu quả. Mời các bạn cùng tham khảo! | Nâng Cao Hiệu Năng Cho Thuật Toán Khai Thác Tập Hiếm Tối Thiểu Trên Bộ Xử Lý Đa Nhân Phan Thành Huấn1 2 Lê Hoài Bắc3 Khoa Toán Tin học Trường Đại học Khoa học Tự nhiên ĐHQG-HCM 1 2 Bộ môn Tin học Trường Đại học Khoa học Xã hội và Nhân văn ĐHQG-HCM 3 Khoa Công nghệ Thông tin Trường Đại học Khoa học Tự nhiên ĐHQG-HCM Email huanphan@ lhbac@ Tóm tắt - Trong khai thác dữ liệu khai thác tập hiếm là một kỹ mảng chứa itemset xuất hiện ít nhất trong một giao dịch của thuật khai thác rất quan trọng với các ứng dụng tiềm năng như từng item hạt nhân thuật toán sinh cây nLOOC-Tree và thuật phát hiện các cuộc tấn công máy tính giao dịch gian lận trong toán tuần tự SEQ-mRI khai thác tập hiếm tối thiểu. Phần 4 các tổ chức tài chính tin sinh học y tế. Trong bài viết này chúng nhóm tác giả dựa trên thuật toán tuần tự ở Phần 3 để xây dựng tôi đề xuất thuật toán song song MCP-mRI nhằm nâng cao hiệu thuật toán song song MCP-mRI khai thác hiệu năng của bộ xử năng cho khai thác tập hiếm tối thiểu trên bộ xử lý đa nhân. Thuật toán đề xuất dễ dàng mở rộng trên nhiều hệ thống tính lý đa nhân. Kết quả thực nghiệm được trình bày trong phần 5 toán phân tán như Hadoop Apache Spark. Kết quả thực nghiệm và kết luận ở phần 6. trên bộ dữ liệu thực của UCI và bộ dữ liệu giả lập của trung tâm nghiên cứu IBM Almaden cho thấy thuật toán đề xuất hiệu quả. II. CÁC KHÁI NIỆM CƠ BẢN Từ khóa - Bộ xử lý đa nhân khai thác dữ liệu tập hiếm tối A. Tập phổ biến thiểu thuật toán song song MCP-mRI. Cho I i1 i2 . im là tập gồm m mục hàng riêng biệt mỗi mục hàng gọi là item. Tập các mục I. GIỚI THIỆU X i1 i2 . ik i j I 1 j k gọi là itemset tập mục có Thuật toán khai thác luật kết hợp truyền thống 1-5 chỉ k mục gọi là k-itemset. Ɗ là dữ liệu giao dịch gồm n bản ghi dùng một giá trị ngưỡng phổ biến tối thiểu minsup với ngầm phân biệt gọi là tập các giao dịch T t1 t2 . tn mỗi giao định là các mặt hàng có cùng tính chất và tần số trong dữ liệu dịch ti ik1 ik 2 . ik j ik j I 1 k j m . điều .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
30    332    1    27-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.