Báo cáo nghiên cứu khoa học: " PHỤ THUỘC DỮ LIỆU VÀ TÁC ĐỘNG CỦA NÓ ĐỐI VỚI BÀI TOÁN PHÂN LỚP CỦA KHAI PHÁ DỮ LIỆU"

Tuyển tập các báo cáo nghiên cứu khoa học của trường đại học Huế: PHỤ THUỘC DỮ LIỆU VÀ TÁC ĐỘNG CỦA NÓ ĐỐI VỚI BÀI TOÁN PHÂN LỚP CỦA KHAI PHÁ DỮ LIỆU. | TẠP CHÍ KHOA HỌC Đại học Huế Số 53 2009 PHỤ THUỘC DỮ LIỆU VÀ TÁC ĐỘNG CỦA NÓ ĐỐI VỚI BÀI TOÁN PHÂN LỚP CỦA KHAI PHÁ DỮ LIỆU Lê Văn Tường Lân Trường Đại học Khoa học Đại học Huế TÓM TẮT Cây quyết định là một trong những giải pháp trực quan và hữu hiệu để mô tả quá trình phân lớp dr liệu. Trên cây quyết định chúng ta dễ dàng tìm ra các luật những luật này cung cẩp thông tin để ra quyết định giải quyết một vấn đề nào đó. Xây dựng một cây quyết định phục vụ khai phá dữ liệu hiệu quả phụ thuộc vào vực chọn tập mẫu huẩn luyện. Trong thục tế dữ liệu nghiệp vụ được lưu trữ rất đa dạng và phức tap cho nên vực chọn tót bộ dữ liệu mau còn gặp nhiều khó khăn. Trong bài báo này chúng tôi tap trung phân tích sự phụ thuộc ta nhiên và st phụ thuộc theo tương quan hàm sổ của dữ liệu nhằm loại bỏ những tính toán dư thừa trong thuật toán học quy nạp và các st phụ thuộc dữ liệu ở mẫu huẩn luyện tao dựng cây quyết định có khả năng Ạt đoán cao nhằm ho trợ ra quyết định trong các bài toán phân tích dữ liệu. Từ khoá Khai phá dữ liệu phát hiện tri thức cây quyết định mẫu huẩn luyện phụ thuộc hàm phụ thuộc hàm xấp ả phân lớp dữ liệu. I. Đặt vấn đề Một trong những đích khai phá dữ liệu trong thực tế nhằm đạt đến là mô tả các mẫu dữ liệu mỗi một sự mô tả là thể hiện những tri thức được khai phá. Sự phân lớp là quá trình nhằm đến một trong những mục đích ấy. Cây quyết định là một trong những giải pháp trực quan và hữu hiệu để mô tả quá trình phân lớp dữ liệu. Do cây quyết định rất hữu dụng nên đã có nhiều nghiên cứu để xây dựng nó mà nổi bật là các thuật toán học quy nạp như CATD ID3 C45 . 3 4 5 7 9 10 . Xây dựng cây quyết định có khả năng dự đoán cao là một trong những mục tiêu quan trọng của khai phá dữ liệu. Để xây dựng được một cây quyết định có hiệu quả thì ngoài các thuật toán học quy nạp tốt việc chọn mẫu huấn luyện đóng một vai trò đáng kể. Khi chọn mẫu huấn luyện sự phụ thuộc tự nhiên giữa các thuộc tính dữ liệu trong mẫu cần phải được đề cập và ứng dụng để loại trừ nó nhằm nâng cao .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.