Phát triển các thuật toán sử dụng hàm LoG cho ứng dụng nhận dạng chữ trong ảnh thời gian thực

Bài viết này thảo luận các nghiên cứu hiện tại các thuật toán cho nhận dạng chữ (Text) trong ảnh dựa vào hàm số LoG (Laplacian of Gaussian) để trích chọn các đặc trưng mức thấp của ảnh chứa text đáp ứng yêu cầu thời gian thực. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR TP. HCM ngày 23-24 12 2021 DOI PHÁT TRIỂN CÁC THUẬT TOÁN SỬ DỤNG HÀM LOG CHO ỨNG DỤNG NHẬN DẠNG CHỮ TRONG ẢNH THỜI GIAN THỰC Nguyễn Đình Công Hoàng Văn Quý Khoa Công nghệ thông tin và Truyền thông Đại học Hồng Đức Thanh Hoá Việt Nam nguyendinhcong@ hoangvanquy@ TÓM TẮT Bài báo này thảo luận các nghiên cứu hiện tại các thuật toán cho nhận dạng chữ Text trong ảnh dựa vào hàm số LoG Laplacian of Gaussian để trích chọn các đặc trưng mức thấp của ảnh chứa text đáp ứng yêu cầu thời gian thực. Thông qua các nghiên cứu hiện tại các chứng minh về lý thuyết được đề xuất nhằm tuỳ chỉnh thuật toán Zero-norm LoG thích ứng với bài toán nhận dạng text thông qua mô hình stroke đảm bảo độ chính xác và thoả mãn yêu cầu thời gian thực thông qua quá trình xấp xỉ hàm Gaussian bằng các hàm hộp box function . Từ khóa LoG mô hình stroke thời gian thực nhận dạng text bất biến với ánh sáng. I. GIỚI THIỆU Nhận dạng chữ text trong ảnh là một trong những chủ đề giành được nhiều sự quan tâm trong cộng đồng nghiên cứu về thị giác máy tính computer vision . Các nghiên cứu tổng hợp có thể tham khảo tại 1 2 . Mục tiêu của các nghiên cứu này là thiết kế các thuật toán ổn định trong các điều kiện khác nhau của ảnh cụ thể các kiểu chữ khác nhau điều kiện ánh sáng thay đổi các góc xoay khác nhau hay sự tương đồng giữa nền và text hình 1. Hình 1. Ví dụ về ảnh text với a Ảnh bị mờ b Ảnh với kích cỡ khác nhau c Ảnh với độ sáng khác nhau. Bên cạnh đó một trong những vấn đề cốt lõi khác là thiết kế các thuật toán tối ưu để đáp ứng các yêu cầu về thời gian xử lý. Để thiết kế các thuật toán như vậy mô hình 2 bước được triển khai. Cụ thể bước 1 là định vị các vùng chứa text trong ảnh localization nhiều nhất có thể với mục tiêu không làm mất các vùng chứa text nào bước 2 xác thực vùng định vị được có thực sự là text hay không verification bằng cách sử dụng các thủ tục .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
41    75    2    19-04-2024
104    74    2    19-04-2024
2    81    2    19-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.