Hệ thống nhúng nhận dạng tiếng nói tiếng Việt sử dụng Mel-Frequency Cepstral Coefficients và Dynamic Time Warping

Bài viết mô hình nhận dạng mẫu từ đơn tiếng Việt được trình bày. Tiếng nói được trích đặc trưng bằng giải thuật MFCC (Mel-Frequency Cepstral Coefficients). Giải thuật thời gian động DTW (Dynamic Time Warping) được sử dụng để so sánh tiếng nói đầu vào với các mẫu thu sẵn, từ đó sẽ chọn ra được kết quả nhận dạng phù hợp nhất với tiếng nói phát ra. Mời các bạn cùng tham khảo! | HộiHội ThảoThảo Quốc Quốc Gia Gia 2015vềvềĐiện 2015 ĐiệnTử Tử Truyền TruyềnThông Thông và và Công CôngNghệ NghệThông ThôngTinTin ECIT 2015 ECIT 2015 Hệ Thống Nhúng Nhận Dạng Tiếng Nói Tiếng Việt Sử Dụng Mel-Frequency Cepstral Coefficients Và Dynamic Time Warping Lê Đức Lộc Trần Văn Hoàng và Hoàng Trang Khoa Điện Điện Tử Trường Đại Học Bách Khoa ĐHQG TP. Hồ Chí Minh Email ducloc0506@ tvhoang@ hoangtrang@ Abstract Trong bài báo này mô hình nhận dạng mẫu từ đơn dạng của hệ thống khi thực nghiệm đối với bộ từ vựng 4 từ là tiếng Việt được trình bày. Tiếng nói được trích đặc trưng bằng giải 9 và đối với bộ từ vựng gồm 10 từ 10 . thuật MFCC Mel-Frequency Cepstral Coefficients . Giải thuật thời gian động DTW Dynamic Time Warping được sử dụng để so Trong bài báo của chúng tôi hệ thống nhận dạng tiếng nói sánh tiếng nói đầu vào với các mẫu thu sẵn từ đó sẽ chọn ra được sử dụng phương pháp nhận dạng DTW được áp dụng với ngôn kết quả nhận dạng phù hợp nhất với tiếng nói phát ra. Hệ thống ngữ tiếng Việt với ưu điểm là tốc độ nhận dạng nhanh đơn nhận dạng được thực hiện và chạy trên board nhúng BeagleBone giản không yêu cầu bộ nhớ lớn với độ chính xác cao cao hơn Black do Texas Instruments sản xuất. Kết quả nhận dạng cao phù so với hệ thống thực hiện bằng ngôn ngữ tiếng anh 9-10 phù hợp với lý thuyết. hợp trong các hệ thống điều khiển yêu cầu tốc độ đáp ứng Keywords Nhận dạng từ đơn tiếng Việt MFCC DTW. nhanh và tài nguyên phần cứng hạn chế. Đặc biệt việc huấn luyện mẫu cho một từ chỉ yêu cầu một lần đọc làm cho tính linh động của hệ thống rất cao. Đồng thời trong bài báo này I. GIỚI THIỆU chúng tôi cũng tiến hành thực nghiệm với một người khác Nhận dạng tiếng nói là một kỹ thuật có nhiều ứng dụng không phải người huấn luyện cho kết quả khả quan chứng tỏ trong cuộc sống trong việc điều khiển bởi ưu điểm lớn nhất sự linh hoạt và tiện dụng của hệ thống khi áp dụng với ngôn của nó là tốc độ cao tương tác cao và trực quan với con ngữ tiếng

Trâm Anh 158 6 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

Kỹ thuật truyền dẫn đa điểm phối hợp trong mạng truyền thông ánh sáng nhìn thấy

6 36 2

Giảm nhỏ kích thước cell EBG bằng cấu trúc phức hợp EBG-DGS đa băng, ứng dụng cho truyền thông di động 5G

5 134 2

Phân tích ảnh hưởng của góc truyền, đường phản xạ và sự phân bố nguồn sáng trong truyền thông ánh sáng khả kiến dùng LED

5 31 2

Phân tích hiệu năng của hệ thống truyền thông chuyển tiếp đường lên với thu thập năng lượng và kết hợp lựa chọn tại nút đích

6 47 2

Kênh truyền sóng trong truyền hình số mặt đất và tác động đến chất lượng truyền dẫn

6 44 2

Đánh giá hiệu năng truyền thông D2D sử dụng vùng hạn chế nhiễu dưới ảnh hưởng của pha-đinh Rayleigh

5 23 2

Mô hình nghiên cứu thực nghiệm về truyền dữ liệu thời gian thực sử dụng ánh sáng đèn LED

6 97 2

Giao thức chuyển giao liên kết trong mạng truyền thông ánh sáng nhìn thấy

5 38 2

Mạng thế hệ mới – Tương lai của Internet và truyền thông

6 37 2

Mô hình đánh giá suy hao hai vùng truyền sóng trong hầm mỏ than chữ nhật

5 35 1

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40643 2392

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24767 248

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24219 4265

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 19862 2838

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19365 1541

Bảng biến đổi Laplace và biến đổi Z

1 19117 612

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19062 2965

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 15988 2956

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 15688 325

Sự so sánh văn bản văn học và tác phẩm văn học

1 14363 131

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Đề thi thử tốt nghiệp THPT môn Sinh học năm 2022-2023 - Sở GD&ĐT Nghệ An (Mã đề 201)

6 46 1 19-04-2024

Tóm tắt Luận án Tiến sĩ Cơ học: Tính chất cơ lý của vật liệu sắt điện ở kích thước nano mét

29 63 1 19-04-2024

Bài giảng An sinh xã hội - Chương 1: Khái luận về an sinh xã hội

13 144 10 19-04-2024

Luận văn Thạc sĩ Tài chính ngân hàng: Hoàn thiện công tác quản lý chi bảo hiểm xã hội tại Bảo hiểm xã hội tỉnh Quảng Nam

119 59 1 19-04-2024

Bài giảng Thực phẩm chức năng: Chương 3 - ThS. Nguyễn Phú Đức

9 74 1 19-04-2024

Luận văn Thạc sĩ Quản trị kinh doanh: Giải pháp hoàn thiện hoạt động marketing trực tuyến của Công ty cổ phần Nghiên cứu và Ứng dụng Thuốc dân tộc

106 179 14 19-04-2024

Ảnh hưởng của tiktok đến việc học của sinh viên trường Đại học Ngoại Thương Cơ sở II - TPHCM

14 547 20 19-04-2024

Thiết bị công nghệ hóa học (Tập 10): Phần 2

248 52 2 19-04-2024

Xây dựng bản đồ hiện trạng rừng của huyện Đồng Phú, tỉnh Bình Phước bằng ảnh vệ tinh Sentinel 2A

11 58 1 19-04-2024

Ebook Nghệ thuật ứng xử cho bạn trẻ: Phần 2

107 81 4 19-04-2024

Bài giảng Hóa học lớp 9 bài 27: Sự ăn mòn của kim loại. Bảo vệ kim loại không bị ăn mòn

18 74 2 19-04-2024

Bài giảng Tiếng Anh lớp 12 Unit 8: Life in the future (Listening) - Trường THPT Bình Chánh

7 55 1 19-04-2024

Bài giảng môn Công nghệ Thương mại điện tử: Chương 3 (Phần 1) - Nguyễn Đức Cương

13 90 2 19-04-2024

Bài giảng Vẽ kỹ thuật 1: Chương 4 - Trần Thanh Ngọc

54 68 3 19-04-2024

Tóm tắt Luận văn Thạc sĩ Tài chính Ngân hàng: Phân tích hoạt động kiểm soát chi thường xuyên ngân sách Nhà nước tại Kho bạc Nhà nước Đà Nẵng

27 58 1 19-04-2024

Đề thi thử tốt nghiệp THPT môn Vật lý năm 2022-2023 - Sở GD&ĐT Nghệ An (Mã đề 202)

4 56 1 19-04-2024

Luật văn Thạc sĩ Luật học: Chống sản xuất và buôn bán hàng giả ở Việt Nam hiện nay nhìn từ góc độ quản lý nhà nước

113 187 2 19-04-2024

Impact of the breadth and depth of outreach on operational sustainability in Vietnam’s formal microfinance institutions

12 265 3 19-04-2024

Nghiên cứu ứng dụng các giải pháp khoa học công nghệ và tổ chức chăn nuôi lợn theo chuỗi giá trị tại vùng Đông Nam Bộ

34 299 1 19-04-2024

Đề thi kết thúc học phần học kì 2 môn Nhập môn nghề nghiệp 1 năm 2019-2020 có đáp án - Trường ĐH Đồng Tháp

2 236 1 19-04-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24767 248

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40643 2392

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 2705 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 4975 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3272 100

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6566 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5613 717

Quản trị khủng hoảng trong quan hệ công chúng

2 3052 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4377 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4658 187