Trong lĩnh vực nhận dạng, vấn đề trích chọn đặc trưng là một bước rất quan trọng, nó có ảnh hưởng lớn đến chất lượng cũng như tốc độ của một hệ thống nhận dạng. Trích chọn đặc trưng như thế nào để vẫn đảm bảo không mất mát thông tin. | TẠP CHÍ KHOA HỌC Đại học Huế Số 53 2009 MỘT SỐ PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG HIỆU QUẢ CHO BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY RỜI RẠC Phạm Anh Phương Trường Đại học Khoa học Đại học Huế TÓM TẮT Trích chọn đặc trưng là một mắt xích rẩt quan trọng ảnh hưởng trục tiểp đen chất lượng của một hệ thong nhận dạng. Bài báo này so sánh một tí phương pháp trích chọn đặc trưng đơn giản nhưng hiệu quả có thể áp dụng cho bài toán nhận dạng chữ viết tay rời rạc. Các tít quả thục nghiệm trên tập dữ liệu chữ tí viết tay MNIST cho thấy một tí đặc trưng mà chúng tôi lụa chọn cho độ chính xác cao hơn so với các tít quả đã được công bổ ờ 9 . I. Giới thiệu Nhận dạng chữ viết tay đang là vấn đề thách thức lớn đối với các nhà nghiên cứu. Cho đến nay bài toán nhận dạng chữ viết tay vẫn chưa có được một giải pháp tổng thể. Các kết quả chủ yếu chỉ tập trung trên các tập dữ liệu chữ số viết tay chuẩn như USPS và MNIST 4 5 8 9 bên cạnh đó cũng có một số công trình nghiên cứu trên các hệ chữ cái tiếng La tinh Hy Lạp Trung Quốc Việt Nam. tuy nhiên các kết quả cũng chỉ giới hạn trong một phạm vi hẹp 2 7 10 . Trong lĩnh vực nhận dạng vấn đề trích chọn đặc trưng là một bước rất quan trọng nó có ảnh hưởng lớn đến chất lượng cũng như tốc độ của một hệ thống nhận dạng. Trích chọn đặc trưng như thế nào để vẫn đảm bảo không mất mát thông tin và hoặc thu gọn kích thước của dữ liệu đầu vào là điều mà nhiều nhà nghiên cứu đang quan tâm. Trong bài báo này chúng tôi cài đặt thử nghiệm và so sánh một số phương pháp trích chọn đặc trưng cho bài toán nhận dạng chữ viết tay rời rạc. Mô hình nhận dạng của chúng tôi được xây dựng trên cơ sở phương pháp véc tơ tựa SVM - Support Vector Machines đây là một phương pháp máy học tiên tiến đã có nhiều thành công trong các lĩnh vực khai phá dữ liệu cũng như nhận dạng 3 6 . Phần còn lại của bài báo này có cấu trúc như sau Phần 2 trình bày kiến trúc của mô hình nhận dạng chữ viết tay rời rạc. Phần 3 trình bày một số phương pháp trích chọn đặc trưng có thể áp dụng cho chữ .