Phát triển hệ thống nhận dạng phương ngữ vùng miền cho tiếng nói tiếng Việt

Bài viết Phát triển hệ thống nhận dạng phương ngữ vùng miền cho tiếng nói tiếng Việt trình bày quá trình tiền xử lý, trích chọn đặc trưng, đưa ra và so sánh hai phương pháp học máy phân loại vùng miền trong tiếng nói tiếng Việt : Rừng ngẫu nhiên - phân loại với học máy thuần, và mô hình mạng tích chập - mô hình phân loại học sâu. | Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN 978-604-82-5957-0 PHÁT TRIỂN HỆ THỐNG NHẬN DẠNG PHƯƠNG NGỮ VÙNG MIỀN CHO TIẾNG NÓI TIẾNG VIỆT Dương Quang Tiến1 Đỗ Văn Hải1 1 Trường Đại học Thủy lợi 1. GIỚI THIỆU CHUNG nhau cho bài toán nhận dạng vùng miền với kho ngữ liệu tiếng Việt. Dữ liệu bao gồm Việt Nam là đất nước đa dạng về phương tệp âm thanh được thu thập từ các ngữ. Với mỗi vùng khác nhau người dân sẽ chương trình quảng cáo chương trình truyền có cách phát âm tiếng Việt riêng - cụ thể trên hình các cuộc phỏng vấn và nhiều nguồn lãnh thổ Việt Nam là 3 miền Bắc Trung khác được áp dụng các phương pháp tiền xử Nam khác nhau ở cả phát âm ngữ điệu âm lý trích xuất đặc trưng sau đó triển khai so vực hay cả từ vựng. sánh hai phương pháp phân loại bằng rừng Bài toán nhận dạng vùng miền đóng góp ngẫu nhiên Random Forest và mô hình vai trò quan trọng trong bài toán nhận dạng mạng nơ-ron tích chập Convolutional Neural tiếng nói. Tính năng nhận dạng vùng miền bổ Network - CNN với đầu vào được xử lý ở sung cho công nghệ trợ lý ảo hay các tổng trên. Thử nghiệm với rừng ngẫu nhiên cho đài tự động mang lại những lợi ích quan kết quả độ chính xác là 62 2 trên tập kiểm trọng cho toàn bộ ngành công nghệ xử lý tra. Kết quả của mạng nơ ron tích chập vượt tiếng nói tổng quan 1 . Một số nghiên cứu trội hơn với độ chính xác 73 9 . về phân loại vùng miền tiếng nói đã được phát triển gần đây tiêu biểu trong đưa ra các 2. PHƯƠNG PHÁP TRIỂN KHAI kết quả tốt nhưng với các ngôn ngữ nước ngoài. Trong phạm vi tiếng Việt theo hiểu Các tệp trong kho ngữ liệu được gán nhãn biết của chúng tôi vẫn chưa có nhiều kết quả phân loại thành 3 loại vùng giọng miền Bắc nổi trội trong bài toán phân loại vùng miền miền Trung và miền Nam. Bộ dữ liệu âm phương ngữ. thanh có nhiễu nền gồm tệp định dạng Trong nghiên cứu này chúng tôi trình bày .wav lấy mẫu ở tần số tách thành sự so sánh hai phương pháp học máy khác tệp cho huấn luyện mô hình 300 tệp Hình 1. Phân bổ về .

Bấm vào đây để xem trước nội dung
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.