Nhận dạng phương ngữ tiếng Việt sử dụng MFCC và tần số cơ bản

Bài viết Nhận dạng phương ngữ tiếng Việt sử dụng MFCC và tần số cơ bản trình bày phương pháp sử dụng đặc trưng MFCC kết hợp với khai thác thông tin về tần số cơ bản (F0) của tiếng Việt để thực hiện nhận dạng phương ngữ tiếng Việt dựa trên mô hình GMM. | Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 DOI: NHẬN DẠNG PHƯƠNG NGỮ TIẾNG VIỆT SỬ DỤNG MFCC VÀ TẦN SỐ CƠ BẢN Phạm Ngọc Hưng1, Trịnh Văn Loan1,2, Nguyễn Hồng Quang2 1 Khoa Công nghệ thông tin, Trường Đại học Sư phạm Kỹ thuật Hưng Yên 2 Viện Công nghệ thông tin và Truyền thông, Trường Đại học Bách khoa Hà Nội pnhung@, loantv@, quangnh@ TÓM TẮT - Nhận dạng phương ngữ đã được nghiên cứu cho nhiều ngôn ngữ trên thế giới tuy nhiên với phương ngữ tiếng Việt, nghiên cứu theo phương diện xử lý tín hiệu đến nay vẫn còn hạn chế, chưa có nhiều công trình được công bố. Tiếng Việt là ngôn ngữ có nhiều phương ngữ khác nhau. Ảnh hưởng của yếu tố phương ngữ tới các hệ thống nhận dạng tự động tiếng nói là rất đáng kể. Nếu biết trước tiếng nói cần nhận dạng thuộc phương ngữ nào thì việc nhận dạng nội dung sẽ thuận lợi hơn do ngữ liệu được tổ chức phù hợp cho từng phương ngữ. Bài báo này sẽ trình bày phương pháp sử dụng đặc trưng MFCC kết hợp với khai thác thông tin về tần số cơ bản (F0) của tiếng Việt để thực hiện nhận dạng phương ngữ tiếng Việt dựa trên mô hình GMM. Kết quả thử nghiệm trên bộ ngữ liệu phương ngữ tiếng Việt cho thấy việc kết hợp các tham số F0 và MFCC so với chỉ dùng MFCC đã tăng tỷ lệ nhận dạng đúng phương ngữ từ lên . Từ khóa - Tần số cơ bản, MFCC, GMM, nhận dạng phương ngữ tiếng Việt. I. GIỚI THIỆU Tiếng Việt là ngôn ngữ có thanh điệu và có nhiều phương ngữ khác nhau. Chính sự đa dạng của các phương ngữ đã tạo nên thách thức đối với các hệ thống nhận dạng tự động tiếng Việt. Chỉ xét về phương diện phát âm, cùng một từ nhưng ở các địa phương khác nhau có thể lại được phát âm theo cách khác nhau. Với hai phương ngữ khác nhau, có những âm nghe như nhau nhưng nội dung lại được hiểu khác nhau theo từng phương ngữ. Chỉ riêng yếu tố này cũng đã có thể gây ra nhầm lẫn, ảnh hưởng đáng kể đến kết quả nhận dạng

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
98    60    1    02-05-2024
41    120    6    02-05-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.