Khai phá dữ liệu sử dụng lý thuyết tập thô

Trong bài báo này, tác giả sử dụng ma trận phân biệt mở rộng trong mô hình tập thô dung sai để xây dựng thuật toán cho bài toán rút gọn thuộc tính trong hệ thông tin đa trị và minh họa kết quả thuật toán qua thực nghiệm. | Ninh Văn Thọ Tạp chí KHOA HỌC & CÔNG NGHỆ 135(05): 19 - 24 KHAI PHÁ DỮ LIỆU SỬ DỤNG LÝ THUYẾT TẬP THÔ Ninh Văn Thọ* Trường Đại học Kỹ thuật Công nghiệp – ĐH Thái Nguyên TÓM TẮT Lý thuyết tập thô đã được sử dụng hiệu quả trong các bước của quá trình khai phá dữ liệu và khám phá tri thức. Trong đó bài toán rút gọn thuộc tính theo tiếp cận lý thuyết tập thô là bài toán quan trọng trong khai thác dữ liệu nói chung và trong rút gọn các thuộc tính nói riêng. Trong thực tế dữ liệu thường đa dạng, phong phú nhưng nhiều khi có thể dư thừa hoặc không đầy đủ, điều này ảnh hưởng đến việc khám phá tri thức từ dữ liệu. Trong bài báo này, tác giả sử dụng ma trận phân biệt mở rộng trong mô hình tập thô dung sai để xây dựng thuật toán cho bài toán rút gọn thuộc tính trong hệ thông tin đa trị và minh họa kết quả thuật toán qua thực nghiệm. Từ khóa: Tập thô dung sai, tập thô, hệ quyết định đa trị, rút gọn thuộc tính, tập rút gọn MỞ ĐẦU* Rút gọn thuộc tính trong hệ quyết định đa trị là tìm ra tập thuộc tính nhỏ nhất có thể được để biểu diễn dữ liệu nhưng vẫn giữ được mối quan hệ ngữ nghĩa giữa các tập thuộc tính. Rút gọn thuộc tính vừa làm giảm khối lượng tính toán do quá trình xử lý dữ liệu chỉ thao tác trên một dung lượng dữ liệu nhỏ hơn, làm cho kết quả thu được từ quá trình xử lý trở nên cô đọng và dễ hiểu hơn. Trên hệ thông tin đa trị, Yan Yong Guan và cộng sự [2] đã mở rộng quan hệ tương tương trong lý thuyết tập thô truyền thống thành quan hệ dung sai và xây dựng mô hình tập thô dung sai bằng cách mở rộng các định nghĩa xấp xỉ trên, xấp xỉ dưới, miền trên quan hệ dung sai. Theo hướng tiếp cận mô hình tập thô dung sai, một số công trình nghiên cứu đáng chú ý về rút gọn thuộc tính trên hệ quyết định đa trị và hệ quyết định đa trị xếp thứ tự có thể kể đến [1, 6, 9]. Trong công trình [11], sử dụng phương pháp ma trận các tác giả đã nghiên cứu sự thay đổi của các tập xấp xỉ khi bổ sung và loại bỏ tập thuộc tính. Tuy nhiên, các kết quả nghiên cứu về rút gọn thuộc .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.