Cải thiện hiệu năng hệ thống nhận dạng tiếng Việt với thông tin về phương ngữ

Bài viết trình bày kết quả th nghiệm nhận dạng phương ngữ tiếng Việt và việc cải thiện hiệu năng của hệ thống nhận dạng tiếng Việt khi có thông tin về phương ngữ. Mời các bạn cùng tham khảo bài viết để nắm chi tiết hơn nội dung nghiên cứu. | Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR 9 Cần Thơ ngày 4-5 8 2016 DOI CẢI THIỆN HIỆU NĂNG HỆ THỐNG NHẬN DẠNG TIẾNG VIỆT VỚI THÔNG TIN VỀ PHƯƠNG NGỮ Phạm Ngọc Hƣng 1 2 Trịnh Văn Loan1 2 Nguyễn Hồng Quang2 Trần Vũ Duy2 1 Khoa Công nghệ thông tin Trường Đại học Sư phạm Kỹ thuật Hưng Yên 2 Viện Công nghệ Thông tin và Truyền thông Trường Đại học Bách khoa Hà Nội phamngochung@ loantv@ quangnh@ tranvuduy14@ TÓM TẮT Tiếng Việt là ngôn ngữ có thanh điệu và có nhiều phương ngữ khác nhau. Ảnh hưởng của yếu tố phương ngữ tới các hệ thống nhận dạng tự động tiếng Việt nói là đáng kể. Có nhiều phương pháp khác nhau đã được nghiên cứu và áp dụng cho nhận dạng phương ngữ như GMM Gaussian Mixture Model Supervector . ài báo tr nh bày kết quả th nghiệm nhận dạng phương ngữ tiếng Việt và việc cải thiện hiệu n ng của hệ thống nhận dạng tiếng Việt khi có thông tin về phương ngữ. Ngữ liệu d ng cho nhận dạng là phương ngữ của ba giọng Hà Nội Huế Thành phố Hồ Chí Minh đại diện cho ba miền ắc Trung Nam. Mô hình GMM đã được d ng để nhận dạng phương ngữ. Kết quả th nghiệm cho th y tỷ lệ nhận dạng đ ng phương ngữ tiếng Việt đạt 71 khi s dụng các tham số MFCC kết hợp với F0 chuẩn hóa theo trung b nh của F0 t ng 12 so với trường hợp chỉ s dụng MFCC. Tỷ lệ nhận dạng tiếng Việt nói s dụng HMM được n ng cao khi b sung thông tin về phương ngữ với lỗi từ là 6 76 giảm 2 61 so với trường hợp chưa có thông tin phương ngữ. Từ khóa Nhận dạng phương ngữ tiếng Việt GMM HMM MFCC tần số cơ bản nhận dạng tiếng Việt nói. I. GIỚI THIỆU Hệ thống nhận dạng tự động tiếng nói đã được nghiên cứu từ sớm và đạt được nhiều tiến bộ. Chất lượng nhận dạng đã được nâng cao tuy nhiên hiệu năng nhận dạng tỷ lệ nhận dạng chưa đúng vẫn còn đáng kể. Có nhiều yếu tố tác động và là nguyên nhân ảnh hưởng đến hiệu năng của hệ thống nhận dạng tự động tiếng nói. Trong số đó có thể kể đến yếu tố về .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
5    64    1    29-04-2024
164    63    2    29-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.