So sánh một số phương pháp phân lớp dùng cho định danh tiếng Việt – Anh – Pháp

Bài viết trình bày kết quả thử nghiệm nhận dạng ba ngôn ngữ Việt, Anh, Pháp sử dụng các bộ phân lớp SMO (Sequential Minimal Optimization), iBK, Multilayer Perceptron của Weka với các đặc trưng được OpenSMILE trích chọn. | ISSN 2354-0575 SO SÁNH MỘT SỐ PHƯƠNG PHÁP PHÂN LỚP DÙNG CHO ĐỊNH DANH TIẾNG VIỆT ANH PHÁP Lê Trung Hiếu Phạm Quốc Hùng Nguyễn Vinh Quy Chu Bá Thành Trường Đại học Sư phạm Kỹ thuật Hưng Yên Ngày tòa soạn nhận được bài báo 20 05 2017 Ngày phản biện đánh giá và sửa chữa 03 09 2017 Ngày bài báo được duyệt đăng 06 09 2017 Tóm tắt Có nhiều phương pháp và mô hình khác nhau đã được nghiên cứu và áp dụng cho nhận dạng ngôn ngữ như mô hình GMM HMM SVM ANN. Bài báo trình bày kết quả thử nghiệm nhận dạng ba ngôn ngữ Việt Anh Pháp sử dụng các bộ phân lớp SMO Sequential Minimal Optimization iBK Multilayer Perceptron của Weka với các đặc trưng được OpenSMILE trích chọn. Số lượng các đặc trưng gồm 384 hệ số. Kết quả thử nghiệm cho thấy tỷ lệ nhận dạng tiếng Việt là cao nhất đạt với bộ phân lớp SMO tiếng Pháp đạt cao nhất 93 5 với bộ phân lớp SMO và Multilayer Perceptron còn tiếng Anh đạt cao nhất 94 75 với bộ phân lớp Multilayer Perceptron. Từ khóa Định danh ngôn ngữ tiếng Việt tiếng Anh tiếng Pháp SVM SMO iBK Multilayer Perceptron Weka. I. GIỚI THIỆU và cú pháp câu sentence syntax . Hình 1 6 mô tả Định danh ngôn ngữ đóng vai trò quan trọng các mức khác biệt giữa các đặc trưng khác nhau của trong các hệ thống dịch nhận dạng tự động. Bài tiếng nói từ các đặc trưng ở mức thấp đến các đặc báo sẽ trình bày các thử nghiệm sử dụng SVM trưng ở mức cao để nhận dạng ngôn ngữ. Support-Vector Machines có so sánh với một số Về mặt âm học có thể sử dụng các đặc trưng phương pháp phân lớp khác để định danh các ngôn như MFCC Mel-Frequency Cepstral Coefficients ngữ Việt Anh Pháp theo phương thức phát âm mà PLP Perceptual Linear Prediction SDC Shifted không phụ thuộc vào nội dung. SVM là một phương Delta Cepstrum . pháp máy học tiên tiến đã được áp dụng khá phổ biến không chỉ trong các lĩnh vực khai phá dữ liệu Cú pháp Từ n-gram mà còn trong lĩnh vực nhận dạng cho phép hệ thống đạt hiệu năng cao 1 2 3 4 5 . Các phần Từ vựng Từ tiếp theo của bài báo được tổ chức như sau phần II giới thiệu .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.