Bài viết này đề xuất một phương pháp ứng dụng mô hình Cascade mask R–CNN x101FPN deconv để nhận dạng hàng và cột. Bài báo cũng đề xuất sử dụng mô hình Faster R–CNN để nhận dạng các ô trong bảng, từ đó đưa ra cấu trúc bảng. Mời các bạn cùng tham khảo! | Bài báo khoa học Nghiên cứu ứng dụng thuật toán nhận dạng cấu trúc bảng dựa trên phát hiện đối tượng Ngô Đại Dương1 Hải Hồng Phan1 Phạm Lê Phương2 1 Học Viện Kỹ thuật Quân Sự hongpth@ daiduong28789@ 2 Trung tâm Thông tin và Dữ liệu KTTV phuongpl80@ Tác giả liên hệ hongpth@ Tel 84 372576968 Ban Biên tập nhận bài 05 3 2021 Ngày phản biện xong 10 5 2021 Ngày đăng bài 25 7 2021 Tóm tắt Nhận dạng cấu trúc bảng là vấn đề quan trọng trong số hóa tài liệu. Với sự phát triển của các kỹ thuật học sâu hiện nay việc phát hiện bảng đã có nhiều bước tiến lớn trong khi đó nhận dạng cấu trúc bảng vẫn gặp rất nhiều khó khăn do cấu trúc bảng phức tạp đặc biệt với dữ liệu thực tế. Bài báo này đề xuất một phương pháp ứng dụng mô hình Cascade mask R CNN x101FPN deconv để nhận dạng hàng và cột. Bài báo cũng đề xuất sử dụng mô hình Faster R CNN để nhận dạng các ô trong bảng từ đó đưa ra cấu trúc bảng. Thuật toán đề xuất được đánh giá trên tập dữ liệu phổ biến như TabStructDB và các tài liệu thu thập được từ các trạm Khí tượng thủy văn. Kết quả thực nghiệm đạt 90 độ chính xác trên các tập dữ liệu này. Thuật toán có khả năng áp dụng hiệu quả vào việc nhận dạng cấu trúc bảng của các tài liệu thông thường đặc biệt thuật toán có khả năng xử lý với các tài liệu lịch sử và các chữ viết tay phù hợp với đặc điểm tài liệu của ngành Khí tượng thủy văn. Từ đó góp phần vào việc số hóa tài liệu lưu trữ và truy xuất thông tin dữ liệu của ngành Khí tượng thủy văn. Từ khóa Nhận dạng cấu trúc bảng Nhận dạng ô Khí tượng thủy văn. 1. Mở đầu Hiện nay chuyển đổi số là một trong những mục tiêu phát triển của quốc gia vì lợi ích mà nó mang lại cho sự phát triển kinh tế xã hội. Một trong các nhiệm vụ quan trọng của chuyển đổi số là số hóa tài liệu. Các tài liệu sổ sách được scan hoặc chụp ảnh rồi lưu vào máy tính dưới dạng định dạng ảnh. Tuy nhiên để khai thác dữ liệu hiệu quả hơn cần số hóa các file này thành các dạng văn bản. Tài liệu được chia thành nhiều vùng như