Một phương pháp xử lý giá trị thiếu và tìm tập rút gọn trên bảng quyết định không đầy đủ

Bài viết Một phương pháp xử lý giá trị thiếu và tìm tập rút gọn trên bảng quyết định không đầy đủ trình bày phương pháp xử lý giá trị thiếu trên hệ thống thông tin không đầy đủ là mở rộng quan hệ không phân biệt được thành quan hệ đặc trưng,. . | MỘT PHƯƠNG PHÁP XỬ LÝ GIÁ TRỊ THIẾU VÀ TÌM TẬP RÚT GỌN TRÊN BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ NGUYỄN THỊ LAN ANH Trường Đại học Sư phạm - Đại học Huế Tóm tắt: Một trong những phương pháp xử lý giá trị thiếu trên hệ thống thông tin không đầy đủ là mở rộng quan hệ không phân biệt được thành quan hệ đặc trưng. Dựa vào quan hệ đó, trong bài báo này chúng tôi xây dựng một số định nghĩa, từ đó đề xuất một thuật toán đi tìm tập rút gọn cho bảng quyết định không đầy đủ. Ngoài ra, một phương pháp mở rộng tập đặc trưng để khắc phục mức độ thiếu chính xác trong việc xử lý giá trị thiếu cũng được chúng tôi nghiên cứu. 1. MỞ ĐẦU Trong thực tế, các cơ sở dữ liệu thường chứa các giá trị thuộc tính thiếu, đó là các giá trị thuộc tính của đối tượng nào đó mà chúng ta không xác định được. Có hai loại giá trị thuộc tính thiếu là: Bị mất (lost), được kí hiệu là “?” và Điều kiện không quan trọng (do not care condition), kí hiệu là “*” [1], [3], [4]. Một hệ thống thông tin IS = (U, A) [5], [8] (tương ứng bảng quyết định DT = (U, C∪D) [5], [8]) có chứa giá trị thuộc tính thiếu được gọi là hệ thống thông tin (tương ứng bảng quyết định) không đầy đủ. Để xử lý các hệ thống thông tin không đầy đủ, G. Busse đã mở rộng quan hệ không phân biệt được [5], [7], [8] thành quan hệ đặc trưng [1], [2], [3]. Với bảng quyết định không đầy đủ ID = (U, C∪D), B⊆C, quan hệ đặc trưng R(B) là một quan hệ hai ngôi trên U được xác định R(B) = {(x, y)∈U x U ⎢ y∈KB(x)}, trong đó, K B ( x) = ∩ [(a, a( x)], với a(x) là giá trị của đối tượng x tại thuộc tính a, gọi là tập a∈B,a ( x )≠?,a ( x )≠* đặc trưng của x. KB(x) là tập hợp nhỏ nhất chứa các đối tượng “tương tự” với x dựa vào các thuộc tính trong B. Kí hiệu U/R(B) là họ gồm tất cả các tập đặc trưng {KB(x), x∈U} tạo thành một phủ của U. R(B) là một mở rộng của quan hệ không phân biệt được IND(B) lên hệ thống thông tin không đầy đủ. R(B) có tính phản xạ, nhưng nói chung là không có tính đối xứng và bắc cầu. Trên ID = (U, C∪D), với quan hệ đặc trưng R(B), B ⊆ C, có .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.