Nhận dạng tiếng nói chữ số Việt sử dụng bộ công cụ

Bài viết trình bày hệ thống nhận dạng tiếng nói chữ số Việt sử dụng Hidden Markov Model (HMM) Tool Kit (HTK) để thực nghiệm đánh giá. Kết quả được kiểm nghiệm bằng các tiếng nói chữ số rời rạc, liên tục và có độ chính xác tương đối cao. | Nhận dạng tiếng nói chữ số Việt sử dụng bộ công cụ NHẬN DẠNG TIẾNG NÓI CHỮ SỐ VIỆT SỬ DỤNG BỘ CÔNG CỤ Ngô Thị Thùy Vân1 Nguyễn Thị Thu Huyền2 Tóm tắt Nhận dạng tiếng nói của con người đã và đang thu hút sự quan tâm nghiên cứu của nhiều nhà khoa học trong và ngoài nước. Trong những năm gần đây có nhiều nghiên cứunhận dạng tiếng nói cho tiếng Việt nhưng chủ yếu tập trung vào nhận dạng từ rời rạc hay hệ thống nhận dạng liên tục với kích thước nhỏ. Bài báo trình bày hệ thống nhận dạng tiếng nói chữ số Việt sử dụng Hidden Markov Model HMM Tool Kit HTK để thực nghiệm đánh giá. Kết quả được kiểm nghiệm bằng các tiếng nói chữ số rời rạc liên tục và có độ chính xác tương đối cao. Từ khóa nhận dạng tiếng nói mô hình Markov ẩn bộ công cụ nhận dạng HTK chữ số Việt hệ thống nhận dạng. 1. Mở đầu Ngay từ khi máy tính ra đời con người đã mơ ước máy tính có thể nói chuyện với mình chính vì vậy việc nghiên cứu các phương pháp và phát triển kỹ thuật nhận dạng tiếng nói đã và đang thu hút rất nhiều sự đầu tư và nghiên cứu của các nhà khoa học trên thế giới. Hiện nay trên thế giới lĩnh vực nhận dạng tiếng nói Speech recognition đã đạt được nhiều tiến bộ vượt bậc việc ra lệnh điều khiển các thiết bị điện tử như ti vi smartphone máy tính bằng giọng nói không còn quá xa lạ với người dùng. Tuy nhiên nhận dạng ngôn ngữ tiếng Anh đã được nghiên cứu khá hoàn thiện còn ngôn ngữ tiếng Việt do có tính chất phức tạp về mặt ngữ âm nên cần tập trung nghiên cứu nhiều hơn. Một hệ thống nhận dạng tiếng nói ở nước ta phải được xây dựng trên nền tảng của tiếng nói tiếng Việt. 2. Nội dung . Nhận dạng tiếng nói Nhận dạng tiếng nói là quá trình xử lý tiếng nói nhằm biến tín hiệu tiếng nói do người phát ra thành tín hiệu số sau đó sử dụng một số giải thuật để đối chiếu giữa tín hiệu thu được tương ứng với dữ liệu tham chiếu nào trong bộ tham chiếu từ điển nhận dạng . Về bản chất đây là quá trình biến đổi tín hiệu âm thanh thu được của người nói qua Micro đường dây điện thoại hoặc các thiết bị khác .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.