Bài viết phát hiện và nhận dạng ảnh ký tự viết tay sử dụng mạng nơron tích chập (CNN – Convolutional Neural Network) và các giải thuật xử lý ảnh; nêu một phương pháp nhận dạng ký tự Latinh viết tay sử dụng mạng nơron tích chập. | ISSN 2354-0575 ISSN 2354-0575 NHẬN DẠNG KÝ TỰ VIẾT TAY SỬ DỤNG MẠNG NƠRON TÍCH CHẬP Nguyễn Quang Hoan1 Phạm Ngọc Hưng2 Nguyễn Đình Tài3 1 2 Trường Đại học Sư phạm Kỹ thuật Hưng Yên 3. Học viện Công nghệ Bưu chính Viễn thông Ngày tòa soạn nhận được bài báo 14 10 2019 Ngày phản biện đánh giá và sửa chữa 14 11 2019 Ngày bài báo được duyệt đăng 11 12 2019 Tóm tắt Bài báo phát hiện và nhận dạng ảnh ký tự viết tay sử dụng mạng nơron tích chập CNN Convolutional Neural Network và các giải thuật xử lý ảnh. Đóng góp chính của bài báo là nêu một phương pháp nhận dạng ký tự Latinh viết tay sử dụng mạng nơron tích chập. Dữ liệu thử nghiệm nhận dạng được lấy từ bộ cơ sở dữ liệu ký tự mẫu viết tay Viện Tiêu chuẩn Kỹ thuật Quốc gia Hoa Kỳ NIST . Kết quả quả thử nghiệm nhận dạng ký tự viết tay đạt độ chính xác khả quan. Từ khoá Mạng nơron học sâu mạng nơron tích chập nhận dạng ký tự viết tay. 1. Giới thiệu xử lý tốt tức các ký tự được tách rời nhau hoàn Nhận dạng ký tự quang học Optical toàn và không chứa nhiễu. Nếu ảnh còn nhiễu Character Recognition OCR là quá trình xử lý hoặc chứa nền phức tạp hoặc chứa các đối tượng chuyển đổi ảnh các ký tự viết tay hoặc ký tự đánh khác ta có thể sử dụng các mạng như R-CNN máy thành các dữ liệu đã được số hoá sau đó trích Region Convolutional Neural Network 1 chọn đặc trưng và nhận dạng. Thực tế cho thấy tỉ mạng Fast R-CNN 2 Faster R-CNN 3 lệ nhận dạng các ký tự đánh máy của nhiều hệ RetinaNet để tách lọc tiếp các ký tự đó. Vì ký tự thống sử dụng mạng học sâu hiện nay đạt độ viết tay đa phần chỉ viết trên các mặt phẳng có chính xác tới 99 8 . Tuy nhiên việc nhận dạng phần nền tách biệt với phần chữ nên trong nghiên ký tự viết tay hiện nay là bài toán chưa có phương cứu này ta giả sử ảnh vào là chữ viết trên giấy pháp giải quyết triệt để và vẫn là một thách thức thông thường không chứa các đối tượng và vật đối với các nhà nghiên cứu do những khác biệt thể gây nhiễu khác như cây cối xe cộ con biến đổi quá đa dạng trong cách viết độ nghiêng người