Bài viết Khai phá luật kết hợp trên cơ sở dữ liệu gia tăng trình bày về thuật toán khai phá luật kết hợp trên cơ sở dữ liệu gia tăng theo chiều dọc. Sau đó, tác giả xây dựng thực nghiệm trên bộ dữ liệu mẫu để đánh giá so sánh với thuật toán Apriori. | Tuyển tập Hội nghị Khoa học thường niên năm 2017. ISBN 978-604-82-2274-1 KHAI PHÁ LUẬT KẾT HỢP TRÊN CƠ SỞ DỮ LIỆU GIA TĂNG Nguyễn Ngọc Quỳnh Châu Trường Đại học Thủy lợi email chaunnq@ 1. GIỚI THIỆU CHUNG thường xuyên thủ tục Candidate xây dựng tập ứng viên Ck 1 từ Lk. Thủ tục Candidate là Khai phá luật kết hợp là một kỹ thuật được thủ tục quan trọng trong giải thuật Gia tăng 1 sử dụng trong khai phá dữ liệu nhằm tìm ra để tìm ra tập mục ứng viên là những tập mục các phần tử thường xuất hiện cùng nhau dữ liệu có khả năng trở thành tập mục thường trong cơ sở dữ liệu. Từ đấy rút ra được các xuyên . Thủ tục này trải qua ba bước luật về ảnh hưởng của một tập phần tử dẫn đến sự xuất hiện của tập phần tử khác. Bước 1 Phân chia Lk thành các lớp Cơ sở dữ liệu gia tăng hay cơ sở dữ liệu tương đương Pi. tăng trưởng incremental database là cơ sở Bước 2 Xây dựng tập W mỗi phần tử dữ liệu mà các giao tác hoặc các mục dữ của W gồm k 1 mục dữ liệu bằng cách kết liệu tăng lên theo thời gian. Bài báo này sẽ nối tiền tố Zi của Pi với mỗi cặp x y LZi. trình bày về thuật toán khai phá luật kết hợp Bước 3 Xây dựng tập ứng viên Ck 1 từ trên cơ sở dữ liệu gia tăng theo chiều dọc W. Những phần tử X nào trong W thỏa mãn 1 2 . Sau đó tác giả xây dựng thực nghiệm điều kiện mọi tập con của X thuộc Lk thì trên bộ dữ liệu mẫu để đánh giá so sánh với phần tử X sẽ được cho thêm vào Ck 1. thuật toán Apriori 3 . . Tính độ hỗ trợ của tập mục ứng viên 2. PHƯƠNG PHÁP NGHIÊN CỨU Thủ tục này sử dụng cấu trúc SC . Ý tưởng thuật toán X Sup Sup Sup X để lưu lại độ hỗ trợ của các tập mục dữ liệu ứng viên đã tính. Thuật toán khai phá cơ sở dữ liệu gia tăng Sau đó khi cần tính độ hỗ trợ của X I theo chiều dọc còn được gọi là Thuật toán trước hết ta tìm xem X đã có trong SC Gia tăng 1 do tác giả Nguyễn Hữu Trọng đề hay không. Nếu đã có X Sup trong SC thì xuất 2 . Cơ sở dữ liệu theo chiều dọc là biểu ta có ngay Sup X Sup mà không cần phải diễn của cơ sở dữ liệu giao tác trong đó các tính lại. .