Ứng dụng công nghệ OCR trích xuất thông tin trên giấy tờ tùy thân trong công tác tiếp dân

Bài viết Ứng dụng công nghệ OCR trích xuất thông tin trên giấy tờ tùy thân trong công tác tiếp dân đề cập đến quy trình trích xuất thông tin trên giấy tờ nhằm cải thiện hiệu suất của phương thức cũ. Quy trình do nhóm nghiên cứu là sự phối hợp giữa kỹ thuật Tesseract OCR và những thuật toán trong lĩnh vực Thị giác máy tính liên quan để đảm bảo quy trình trích xuất nhanh, hiệu quả và mới mẻ. | ỨNG DỤNG CÔNG NGHỆ OCR TRÍCH XUẤT THÔNG TIN TRÊN GIẤY TỜ TÙY THÂN TRONG CÔNG TÁC TIẾP DÂN Nguyễn Minh Quân Phạm Hồng Phúc Nguyễn Trọng Nhân Khoa Công nghệ Thông tin Trường Đại học Công Nghệ TP. Hồ Chí Minh GVHD ThS. Võ Hoàng Khang TÓM TẮT Hiện nay công nghệ nhận dạng ký tự quang học OCR - Optical Character Recognition đang là công nghệ chủ đạo đóng vai trò quan trọng trong các nghiệp vụ liên quan đến xử lý và trích xuất thông tin giấy tờ. Tuy nhiên vấn đề tích hợp công nghệ OCR vào việc giải quyết các bài toán liên quan đến công việc thủ tục hành chính công lại không được chú trọng. Vấn đề này là một trong những lý do làm chậm quá trình công nghệ hóa công tác giấy tờ trong nghiệp vụ hành chính công. Trong bài báo này nhóm đề cập đến quy trình trích xuất thông tin trên giấy tờ nhằm cải thiện hiệu suất của phương thức cũ. Quy trình do nhóm nghiên cứu là sự phối hợp giữa kỹ thuật Tesseract OCR và những thuật toán trong lĩnh vực Thị giác máy tính liên quan để đảm bảo quy trình trích xuất nhanh hiệu quả và mới mẻ. Từ khóa chuyển đổi số computer vision extract information ocr tesseract. 1. GIỚI THIỆU Ứng dụng công nghệ OCR trích xuất thông tin giấy tờ tùy thân trong công tác tiếp dân là ứng dụng chuyển đổi hình ảnh do người dân cung cấp thành một tập tin dữ liệu chứa các thông tin tương ứng trên giấy tờ mà máy tính có thể đọc được. Nghiên cứu của chúng tôi được xây dựng dựa trên những kỹ thuật thuật toán trích xuất đã được phổ biến trước đó. Trong quá trình tìm hiểu chúng tôi nhận thấy áp dụng các mô hình OCR truyền thống lên hình ảnh là chưa đủ để nhận diện một cách chính xác. Vì thế chúng tôi đề xuất trích xuất thông tin theo quy trình sáu bước một quy trình đảm bảo tính chuyên môn đạt yêu cầu thực tế và có khả năng mở rộng cao tính nhất quán . Chúng tôi đã ứng dụng nền tảng trích xuất thông tin này trong dự án mà nhóm đang xây dựng mang tên Hệ thống tiếp dân thông minh - Hutech Smart Bot bước đầu có những đánh giá khả quan và giải quyết được những nhu cầu thực tế mà

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.