Một cải tiến thuật toán FCM để phân cụm dữ liệu lớn và ứng dụng cho truy vấn ảnh

Bài viết giới thiệu kết quả mới sử dụng phép phân cụm mờ C-Means (FCM) cải tiến thay thế cho K-means để chọn các điểm neo trong tập ảnh cần tra cứu. Thực nghiệm đã chứng tỏ tính hiệu quả của đề xuất cách chọn tập các điểm neo cho thuật toán EMR bằng phương pháp phân cụm mới đã thực sự tăng chất lượng truy vấn ảnh. | Công nghệ thông tin amp Cơ sở toán học cho tin học MỘT CẢI TIẾN THUẬT TOÁN FCM ĐỂ PHÂN CỤM DỮ LIỆU LỚN VÀ ỨNG DỤNG CHO TRUY VẤN ẢNH Hoàng Văn Quý1 Ngô Hoàng Huy2 Nguyễn Thế Cường1 Nguyễn Tu Trung3 Nguyễn Văn Quyền4 Tóm tắt Thuật toán đánh hạng đa tạp EMR được sử dụng rộng rãi trong truy vấn ảnh với cơ sở dữ liệu lớn. Việc xây dựng đồ thị quan hệ kề nhờ các điểm neo trên không gian vector các đặc trưng ảnh mức thấp đã được thiết kế hiệu quả dựa trên phân cụm K-means. Bài báo giới thiệu kết quả mới sử dụng phép phân cụm mờ C-Means FCM cải tiến thay thế cho K-means để chọn các điểm neo trong tập ảnh cần tra cứu. Thực nghiệm đã chứng tỏ tính hiệu quả của đề xuất cách chọn tập các điểm neo cho thuật toán EMR bằng phương pháp phân cụm mới đã thực sự tăng chất lượng truy vấn ảnh. Từ khóa Big data EMR K-means FCM CBIR. 1. MỞ ĐẦU Độ đo đánh hạng đa tạp 1-5 đo độ tương tự của các ảnh được sử dụng rộng rãi trong CBIR. Với một giả định rằng mỗi điểm dữ liệu trong một không gian đặc trưng có một mối quan hệ với các điểm dữ liệu khác tương tự trong không gian thuật toán trước hết xây dựng một đồ thị có trọng số cho tất cả các điểm dữ liệu trong không gian đặc trưng ở đó mỗi cạnh được gán một trọng số để biểu diễn mối liên quan dữ liệu giữa hai điểm. Đầu tiên điểm dữ liệu truy vấn ban đầu được gán một giá trị nhất định các điểm dữ liệu còn lại có liên quan được gán giá trị 0. Thứ hai tất cả các điểm dữ liệu lan truyền xếp hạng của chúng đến các điểm dữ liệu bên cạnh thông qua các đồ thị có trọng số. Quá trình lan truyền của các điểm số xếp hạng lặp đi lặp lại cho đến khi hội tụ tới một tình trạng ổn định toàn cục. Các điểm chính thức được xếp hạng đại diện cho việc giống nhau giữa điểm dữ liệu và điểm truy vấn. Các điểm dữ liệu tương tự như các điểm truy vấn là những điểm xếp hạng lớn nhất. Để tăng hiệu quả tính toán EMR đã sử dụng các điểm neo thay thế cho việc xét toàn bộ tập dữ liệu ảnh. Các điểm neo được xác định bằng tâm của các cụm thu được sau khi sử dụng thuật toán phân

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
170    221    1    28-04-2024
95    68    2    28-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.