Nhận dạng chữ viết tay rời rạc trên cơ sở phương pháp máy véc tơ tựa

Bài báo cáo: Nhận dạng chữ viết tay rời rạc trên cơ sở phương pháp máy véc tơ tựa có nội dung xây dựng mô hình nhận dạng chữ viết tay rời rạc dựa trên phương pháp SVM, đồng thời tiến hành cài đặt thử nghiệm trên các tập dữ liệu chữ số viết tay chuẩn MNIST và dữ liệu chữ viết tay tiếng Việt. | Bộ Giáo dục và Đào tạo - Trường Đại học Duy Tân NHẬN DẠNG CHỮ VIẾT TAY RỜI RẠC TRÊN CƠ SỞ PHƯƠNG PHÁP MÁY VÉC TƠ TỰA PHẠM ANH PHƯƠNG * LÊ THANH LONG** VÕ VĂN LƯỜNG** ABSTRACT This paper proposes an isolated handwritten character recognition model based on Support Vector Machines. Our experiments on the benchmark database MNIST and samples of Vietnamese handwriting character show that our recognition model reached higher accuracy than neuron network model. We also evaluate the advantages and disadvantages of SVM and propose research solutions. Key words: Handwritten Character Recognition; SVM. 1. Giới thiệu Cho đến nay, việc nhận dạng chữ viết tay vẫn chưa có được một giải pháp tổng thể, các ứng dụng của nó cũng chỉ giới hạn trong phạm vi hẹp. Các kết quả chủ yếu về lĩnh vực này chỉ tập trung trên các tập dữ liệu chữ số viết tay chuẩn như USPS và MNIST [2,3,6,8], bên cạnh đó cũng có một số công trình nghiên cứu trên các hệ chữ cái tiếng La tinh, Hy Lạp, Trung Quốc, Việt Nam. tuy nhiên các kết quả đạt được cũng còn nhiều hạn chế [4,5,7,8]. Các giải pháp tiếp cận để giải bài toán nhận dạng chữ viết tay khá phong phú, một số phương pháp học máy thường được áp dụng như: mô hình Markov ẩn, mạng nơ ron hay phương pháp máy véc tơ tựa (SVM - Support Vector Machines). Trong đó SVM được đánh giá là phương pháp học máy tiên tiến đang được áp dụng rộng rãi trong các lĩnh khai phá dữ liệu và thị giác máy tính SVM gốc được thiết kế để giải bài toán phân lớp nhị phân, ý tưởng chính của phương pháp này là tìm một siêu phẳng phân cách sao cho khoảng cách lề giữa hai lớp đạt cực đại. Khoảng cách này được xác định bởi các véc tơ tựa (SV - Support Vector), các SV này được lọc ra từ tập mẫu huấn luyện bằng cách giải một bài toán tối ưu lồi [3]. Trong bài báo này, chúng tôi sẽ xây dựng mô hình nhận dạng chữ viết tay rời rạc dựa trên phương pháp SVM, đồng thời tiến hành cài đặt thử nghiệm trên các tập dữ liệu chữ số viết tay chuẩn MNIST và dữ liệu chữ viết tay tiếng Việt do chúng .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.