Mạng nơron mờ là một mạng nơron nhân tạo mà phối hợp của các khái niệm mờ, các luật suy diễn mờ với kiến trúc và việc học của các mạng nơron. Phân cụm dữ liệu là một công cụ quan trọng của khai thác dữ liệu và tìm ra tri thức trong một số lượng lớn dữ liệu. Fuzzy ART (Fuzzy Adaptive Resonance Theory) là một mạng nơron mờ mà giải quyết bài toán phân cụm dữ liệu tốt hơn các phương pháp phân cụm truyền thống. Trong nghiên cứu này, chúng tôi phân tích các ưu điểm của Fuzzy ART và hướng dẫn chọn các tham số của mô hình Fuzzy ART để giải bài toán phân cụm cho các tập dữ liệu đạt độ chính xác cao nhất. | Nông Thị Hoa và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 106(06): 49 - 53 SỬ DỤNG MẠNG NƠRON NHÂN TẠO FUZZY ART ĐỂ PHÂN CỤM DỮ LIỆU Nông Thị Hoa1*, Hoàng Trọng Vĩnh2 1 Trường Đại học Công nghệ Thông tin & Truyền thông - ĐH Thái Nguyên 2 Công ty FPT software TÓM TẮT Mạng nơron mờ là một mạng nơron nhân tạo mà phối hợp của các khái niệm mờ, các luật suy diễn mờ với kiến trúc và việc học của các mạng nơron. Phân cụm dữ liệu là một công cụ quan trọng của khai thác dữ liệu và tìm ra tri thức trong một số lượng lớn dữ liệu. Fuzzy ART (Fuzzy Adaptive Resonance Theory) là một mạng nơron mờ mà giải quyết bài toán phân cụm dữ liệu tốt hơn các phương pháp phân cụm truyền thống. Trong nghiên cứu này, chúng tôi phân tích các ưu điểm của Fuzzy ART và hướng dẫn chọn các tham số của mô hình Fuzzy ART để giải bài toán phân cụm cho các tập dữ liệu đạt độ chính xác cao nhất. Các thực nghiệm được làm với 5 tập dữ liệu chuẩn trong cơ sở dữ liệu UCI để chứng minh tính hiệu quả của Fuzzy ART. Kết quả thực nghiệm cho thấy Fuzzy ART cho kết quả phân cụm với độ chính xác cao. Từ khóa: Fuzzy ART, ART, Fuzzy Neural Network, Fuzzy Set, Clustering GIỚI THIỆU* Phân cụm dữ liệu là một công cụ quan trọng của khai thác dữ liệu và tìm ra tri thức trong một số lượng lớn dữ liệu. Hơn nữa, phân cụm còn tổng hợp một số lượng lớn dữ liệu trong một số lượng nhỏ các nhóm nên phân cụm có ích cho cho việc hiểu một số lượng lớn dữ liệu. Một số phương pháp phân cụm truyền thống đã được đưa ra như K-mean [2], phân cụm phân cấp [3], và mô hình SOM [6] nhưng độ phức tạp tính toán của các phương pháp này khá lớn. Fuzzy ART [1] là một mạng nơron mờ có các ưu điểm gồm: Học dữ liệu huấn luyện cho đến khi thỏa mãn một điều kiện nhất định, có thể sinh ra nhóm mới mà không phá vỡ các nhóm đang tồn tại, dễ dàng lựa chọn các tham số của mạng. Do đó, Fuzzy ART phân cụm dữ liệu với độ chính xác cao và giảm đáng kể độ phức tạp tính toán. BÀI TOÁN PHÂN CỤM DỮ LIỆU Phát biểu bài toán Cho tập dữ liệu D. Mỗi dữ liệu I trong tập .