Nghiên cứu nhằm minh chứng cho các đề xuất, chúng tôi thực nghiệm và đánh giá kết quả trên tập dữ liệu ảnh COREL (có 1000 ảnh) đồng thời so sánh với các công trình khác đã được công bố gần đây trên cùng bộ dữ liệu. Theo như kết quả thực nghiệm, những đề xuất của chúng tôi là khả thi và có thể ứng dụng cho các hệ thống tìm kiếm ảnh khác nhau. Mời các bạn cùng tham khảo! | Tạp chí Khoa học Công nghệ và Thực phẩm 21 2 2021 202-215 MỘT PHƯƠNG PHÁP GOM CỤM DỮ LIỆU CHO BÀI TOÁN TÌM KIẾM ẢNH Nguyễn Thị Thuỳ Trang Trần Như Ý Huỳnh Thị Châu Lan Phan Thị Ngọc Mai Trường Đại học Công nghiệp Thực phẩm Email maiptn@ Ngày nhận bài 05 3 2021 Ngày chấp nhận đăng 24 5 2021 TÓM TẮT Trong bài báo này một cải tiến thuật toán K-Means được đề xuất nhằm phân cụm dữ liệu và áp dụng cho bài toán tìm kiếm ảnh tương tự theo nội dung. Để thực hiện được điều này chúng tôi sử dụng một giá trị ngưỡng đo độ tương tự giữa các đối tượng dữ liệu ngưỡng này được kí hiệu là . Trên cơ sở ngưỡng thuật toán K-Means được cải tiến bằng cách không xác định trước số tâm cụm số cụm dữ liệu tăng trưởng theo sự gia tăng của số lượng hình ảnh. Đặc trưng của hình ảnh được trích xuất dưới dạng một véc-tơ có n chiều và là dữ liệu đầu vào cho thuật toán K-Means đã được cải tiến để từ đó tìm kiếm các hình ảnh tương tự. Nhằm minh chứng cho các đề xuất chúng tôi thực nghiệm và đánh giá kết quả trên tập dữ liệu ảnh COREL có 1000 ảnh đồng thời so sánh với các công trình khác đã được công bố gần đây trên cùng bộ dữ liệu. Theo như kết quả thực nghiệm những đề xuất của chúng tôi là khả thi và có thể ứng dụng cho các hệ thống tìm kiếm ảnh khác nhau. Từ khoá Phân cụm K-Means độ đo tương tự ảnh tương tự. 1. GIỚI THIỆU Trong những năm gần đây nhiều hệ thống tìm kiếm đã được công bố nhằm giải quyết bài toán tìm kiếm ảnh tương tự trong các cơ sở dữ liệu đa phương tiện. Có nhiều lĩnh vực khác nhau áp dụng kỹ thuật tìm kiếm ảnh như y tế thời trang hệ thống giám sát đối tượng hệ thống thông tin địa lý thư viện số. 1 2 nhiều hệ thống tra cứu ảnh dựa trên nội dung CBIR Content-Based Image Retrieval đã được giới thiệu 3 4 . Một số công trình tìm kiếm ảnh đã được công bố như tìm kiếm ảnh dựa trên thuật toán K-Means 5 tìm kiếm ảnh dựa trên hình dạng màu sắc cấu trúc đối tượng đặc trưng 6 7 . Các công trình đã khảo sát tập trung vào kỹ thuật trích xuất đặc trưng kỹ thuật đối sánh và tìm