Trong bài báo này, chúng tôi trình bày một mô hình tìm kiếm ảnh dựa trên phân cụm dữ liệu bằng cây BKD-Tree, một cải tiến cải tiến của cây KD-Tree, gồm: lưu trữ các đối tượng đa chiều tại nút lá để tạo ra một sự phân cụm trên cơ sở phương pháp học bán giám sát; tạo ra một cấu trúc cây cân bằng nhằm tăng hiệu suất cho bài toán tìm kiếm ảnh. | Tạp chí Khoa học Đại học Huế Kỹ thuật và Công nghệ pISSN 2588-1175 eISSN 2615-9732 Tập 129 Số 2A 2020 Tr. 49 61 DOI MỘT PHƯƠNG PHÁP PHÂN CỤM DỰA TRÊN CÂY KD-TREE CHO BÀI TOÁN TÌM KIẾM ẢNH Nguyễn Thị Định1 Lê Thị Vĩnh Thanh2 Nguyễn Văn Thịnh1 Văn Thế Thành3 Khoa Công nghệ Thông tin Trường ĐH Công nghiệp Thực phẩm 1 2Viện Công nghệ Thông tin Điện - Điện tử Trường Đại học Bà Rịa Vũng Tàu 3 Phòng Quản lý khoa học và Đào tạo sau đại học Trường ĐH Công nghiệp Thực phẩm Tóm tắt. Trong bài báo này chúng tôi trình bày một mô hình tìm kiếm ảnh dựa trên phân cụm dữ liệu bằng cây BKD-Tree một cải tiến cải tiến của cây KD-Tree gồm 1 lưu trữ các đối tượng đa chiều tại nút lá để tạo ra một sự phân cụm trên cơ sở phương pháp học bán giám sát 2 tạo ra một cấu trúc cây cân bằng nhằm tăng hiệu suất cho bài toán tìm kiếm ảnh. Dựa trên cơ sở lý thuyết đề nghị mô hình truy vấn ảnh trên cây BKD-Tree được đề xuất và thực nghiệm trên bộ ảnh ImageCLEF gồm ảnh . Kết quả thực nghiệm của chúng tôi được so sánh với một số công trình gần đây trên cùng bộ dữ liệu để minh chứng tính hiệu quả của phương pháp đã được đề xuất. Theo kết quả thực nghiệm cho thấy phương pháp của chúng tôi là hiệu quả và có thể áp dụng được cho các hệ thống tìm kiếm ảnh tương tự theo nội dung. Từ khóa BKD-Tree độ đo tương tự phân cụm ảnh tương tự tìm kiếm ảnh 1 Giới thiệu Trong những thập niên gần đây cùng với sự phát triển nhanh chóng của kho dữ liệu ảnh các kỹ thuật tìm kiếm cũng được quan tâm nghiên cứu và tập trung theo 3 hướng chính tìm theo từ khóa TBIR Text-based Image Retrieval tìm theo nội dung CBIR Content-based Image Retrieval hay tìm theo ngữ nghĩa SBIR Semantic-based Image Retrieval 8 9 . Trong tìm kiếm ảnh vấn đề gom cụm dữ liệu theo các chủ đề là một yêu cầu quan trọng. Ngày nay nhiều phương pháp gom cụm dữ liệu được thực hiện bằng nhiều thuật toán khác nhau trong đó kỹ thuật gom cụm sử dụng cây KD-Tree cho kết quả khá tốt. Cây KD-Tree là một cấu trúc