Thuật toán khai thác tập hữu ích cao dựa trên di truyền với đột biến xếp hạng

Bài viết "Thuật toán khai thác tập hữu ích cao dựa trên di truyền với đột biến xếp hạng" trình bày hai cách tiếp cận để khai thác HUI có chứa mục giá trị âm từ CSDL giao dịch: có hoặc không có chỉ định ngưỡng hữu ích tối thiểu thông qua thuật giải di truyền với đột biến được xếp hạng . Mời các bạn cùng tham khảo! | HUFLIT Journal of Science RESEARCH ARTICLE THUẬT TOÁN KHAI THÁC TOP-K TẬP HỮU ÍCH CAO DỰA TRÊN DI TRUYỀN VỚI ĐỘT BIẾN XẾP HẠNG Phạm Đức Thành Lê Thị Minh Nguyện Khoa Công nghệ thông tin Trường Đại học Ngoại ngữ -Tin học thanhpd@ nguyenltm@ TÓM TẮT Khai thác độ hữu ích là nghiên cứu khai thác tập mục có lợi từ cơ sở dữ liệu giao dịch. Đây là phương pháp khai thác tập phổ biến dựa trên độ hữu ích để tìm tập mục phù hợp với sở thích của người dùng. Những nghiên cứu gần đây về khai thác các tập mục hữu ích cao HUIs từ cơ sở dữ liệu CSDL phải đối mặt với hai thách thức lớn đó là không gian tìm kiếm theo cấp số nhân và ngưỡng hữu ích tối thiểu phụ thuộc vào CSDL. Không gian tìm kiếm vô cùng lớn khi số lượng các mục riêng biệt và kích thước của CSDL lớn. Các nhà phân tích phải chỉ định các ngưỡng hữu ích tối thiểu để phù hợp với những công việc khai thác của họ mặc dù có thể họ không có kiến thức liên quan đến CSDL mà họ đang làm. Hơn nữa thuật toán khai thác độ hữu ích chỉ hỗ trợ tập mục mang giá trị dương. Để tránh những vấn đề này chúng tôi trình bày hai cách tiếp cận để khai thác HUI có chứa mục giá trị âm từ CSDL giao dịch có hoặc không có chỉ định ngưỡng hữu ích tối thiểu thông qua thuật giải di truyền với đột biến được xếp hạng. Theo sự tìm hiểu của chúng tôi đây là nghiên cứu đầu tiên trong khai thác HUI với các giá trị mang mục âm từ CSDL giao dịch sử dụng thuật giải di truyền. Kết quả thử nghiệm cho thấy các phương pháp tiếp cận được mô tả trong bài viết này đạt được hiệu suất tốt hơn về khả năng mở rộng và tính hiệu quả. Từ khóa Khai thác tập hữu ích cao ngưỡng hữu ích tối thiểu độ hữu ích CSDL giao dịch thuật giải di truyền. GIỚI THIỆU Một trong những lĩnh vực nghiên cứu chính của trí tuệ nhân tạo AI là khai thác dữ liệu. Sự gia tăng dữ liệu trong nhiều lĩnh vực khác nhau tạo ra một tập hợp các thách thức và cơ hội trong cách tìm kiếm và truy xuất thông tin. Bởi vì khối lượng lớn dữ liệu cần phải được phân tích nên nhiều kỹ .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
5    92    1    28-04-2024
260    72    2    28-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.