Nghiên cứu được thực hiện qua nhiều công đoạn như rút trích đặc trưng cục bộ cho ảnh, sau đó thực hiện phân vùng ảnh với thuật toán DBSCAN (Density-Based Spatial Clustering of Application with Noise), gom cụm các đặc trưng cục bộ và đối sánh từng vùng ảnh tài liệu với giải thuật đối sánh các đặc trưng cục bộ SIFT, SURF. | Xây dựng công cụ hỗ trợ đọc xuất bản phẩm lưu chiểu dựa trên phương pháp đối sánh ảnh tài liệu AGU International Journal of Sciences – 2019, Vol. 23 (2), 96 - 108 XÂY DỰNG CÔNG CỤ HỖ TRỢ ĐỌC XUẤT BẢN PHẨM LƯU CHIỂU DỰA TRÊN PHƯƠNG PHÁP ĐỐI SÁNH ẢNH TÀI LIỆU Phạm Thị Minh Thư1, Lê Việt Phương1 1 Trường Cao đẳng nghề An Giang 2 Sở Thông Tin và Truyền Thông Tỉnh An Giang Thông tin chung: ABSTRACT Ngày nhận bài: 01/10/2018 Ngày nhận kết quả bình duyệt: The research was carried out in many stages such as local features 14/11/2018 extraction image, then segmenting the image by DBSCAN algorithm Ngày chấp nhận đăng: (Density-Based Spatial Clustering of Application with Noise), clustering 08/2019 local features and comparing each document image area to matching local Title: features algorithms (SIFT, SURF). Finally, determining the mismatched A supportive tool for reading areas, wrong positions of licensing printing and has been printed document depository publications based images. The propose method is capable to decay document images into each on document image matching separated block (title, image, paragraph, table), do not use machine learning and do not need to know the detail layout of document images Keywords: Document images matching, previously; the matching performance is more accurately because of only local feature, DBSCAN, SIFT, using each decayed image region to matching and detect the differences SURF instead of using all document images. The experimental result on 223 document images were collected at “Read Depositary” part, presented the Từ khóa: accuracy of the propose method is 91%, also found the difference image Đối sánh ảnh tài liệu, gom cụm DBSCAN, đặc trưng regions between two document images and found the wrong position about SIFT, SURF layout on two document images. TÓM TẮT Nghiên cứu được thực hiện qua nhiều công đoạn như rút trích đặc trưng cục bộ cho ảnh, sau đó thực hiện phân vùng ảnh với