Các đặc trưng âm thanh sử dụng trong mô hình nhận dạng giọng nói

Nghiên cứu này tập trung vào một số kỹ thuật được sử dụng phổ biến nhất bao gồm Mel Frequency Cepstral Coefficients (MFCC), Linear Prediction Coefficients (LPC), Linear Prediction Cepstral Coefficients (LPCC). Các dữ liệu đặc trưng này được sử dụng để xây dựng và huấn luyện mô hình học máy nhận dạng sự có mặt của các từ khóa trong giọng nói thu âm được. | Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN 978-604-82-7522-8 CÁC ĐẶC TRƯNG ÂM THANH SỬ DỤNG TRONG MÔ HÌNH NHẬN DẠNG GIỌNG NÓI Nguyễn Huy Thế Nguyễn Tuấn Anh Trường Đại học Thủy lợi email nguyenhuythe@ 1. GIỚI THIỆU CHUNG dạng .wav của hơn 30 từ tiếng Anh khác nhau với thời lượng khoảng 1s. Để đơn giản quá Nhận dạng giọng nói ngày càng được áp trình tính toán nghiên cứu này chỉ sử dụng các dụng rộng rãi đặc biệt là trong các lĩnh vực file âm thanh tương ứng với tám từ khóa yes tương tác người - máy bởi sự đa dạng và linh up down left right stop go off . hoạt trong ngôn ngữ giao tiếp. Các phương pháp nhận dạng giọng nói phổ biến dựa trên . Trích xuất đặc trưng âm thanh việc trích xuất thông tin đặc trưng từ giọng nói và sử dụng để huấn luyện các mô hình . Kỹ thuật MFCC nhận dạng. Trích xuất các đặc trưng âm thanh MFCC là một kỹ thuật phổ biến hàng đầu là bước rất quan trọng quyết định độ chính trong việc xử lý và nhận dạng giọng nói. Quá xác và hiệu quả của mô hình nhận dạng cần trình tính toán đặc trưng MFCC dựa trên thang được thực hiện đảm bảo yêu cầu hạn chế tối đo Mel có nguyên lý tương tự như cách cảm đa hoặc không mất mát thông tin. nhận âm thanh của tai người. Các bộ lọc tần số Hiện nay có rất nhiều kỹ thuật trích xuất được đặt cách đều nhau tại các tần số thấp và đặc trưng giọng nói đã được phát triển. được bố trí theo thang logarit tại các tần số Nghiên cứu này tập trung vào một số kỹ thuật cao từ đó thu được các đặc tính quan trọng về được sử dụng phổ biến nhất bao gồm Mel mặt ngữ âm của tín hiệu giọng nói. Bước đầu Frequency Cepstral Coefficients MFCC tiên của quá trình tính toán là chia nhỏ tệp tín Linear Prediction Coefficients LPC Linear hiệu âm thanh thu được thành các khung dữ Prediction Cepstral Coefficients LPCC . Các liệu. Sau đó là quá trình kích hoạt các mức tần dữ liệu đặc trưng này được sử dụng để xây số cao để tránh làm mất mát thông tin. Phép dựng và huấn luyện mô hình học máy nhận biến đổi Fast Fourier .

Thành Châu 14 3 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Bài giảng môn học Kỹ thuật thông tin số

39 369 19

BÀI GIẢNG MÔN: KỸ THUẬT THÔNG TIN SỐ

40 293 3

Giáo trình Kỹ thuật tỉa rau củ quả (Ngành: Kỹ thuật chế biến món ăn - Trung cấp) - Trường Trung cấp Du lịch và Khách sạn Saigontourist

27 204 2

Kỹ thuật cao áp

75 350 23

Ebook Sổ tay kỹ thuật trồng và chăm sóc một số chủng loại cây ăn quả - NXB Khoa học Kỹ thuật

164 223 5

Đề cương môn cơ sở kỹ thuật điện tử - Trường ĐH Sư phạm Kỹ thuật Tp. HCM

55 1046 71

Giáo trình Thông tin số

213 650 31

Kỹ thuật nuôi cá trê, Kỹ thuật nuôi lươn, Nuôi giun đất, Kỹ thuật ương giống, Kỹ thuật sản xuất giống, Nuôi cá thịt

5 297 8

Cad trong kỹ thuật: Các bước xuất bản vẽ kỹ thuật

17 219 0

Kỹ thuật trồng hoa anh túc: Kỹ thuật trồng a phiến, kỹ thuật trồng thẩu, trẩu, cây nàng tiên

7 256 2

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40692 2394

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24826 248

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24276 4267

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 19911 2841

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19392 1542

Bảng biến đổi Laplace và biến đổi Z

1 19136 612

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19121 2965

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 16030 2956

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 15758 326

Sự so sánh văn bản văn học và tác phẩm văn học

1 14470 131

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Bài giảng Cơ sở toán học cho tin học

42 507 21 29-04-2024

Luận văn Thạc sĩ Khoa học lâm nghiệp: Nghiên cứu một số giải pháp bảo tồn đa dạng sinh học có sự tham gia ở khu bảo tồn thiên nhiên Phong Quang - tỉnh Hà Giang

156 63 1 29-04-2024

Bàn về các học thuyết pháp lý định hướng cho việc xây dựng và hoàn thiện pháp luật về người đại diện của đương sự trong tố tụng dân sự Việt Nam

6 142 1 29-04-2024

Trọng tâm kiến thức Tiếng Anh lớp 11

80 368 2 29-04-2024

Bài giảng Lịch sử 6 bài 18: Bước ngoặt Lịch sử đầu thế kỉ X (Tiết 1)

7 93 1 29-04-2024

Câu hỏi và đáp án môn Giải phẫu bệnh

5 265 1 29-04-2024

Đánh giá tác dụng điều trị đau thắt lưng do thoái hóa cột sống bằng sóng siêu âm kết hợp viên hoàn độc hoạt tang ký sinh

5 65 2 29-04-2024

Nghiên cứu đề xuất phương án cải tạo và phục hồi môi trường cụm mỏ đá - Trường hợp điển hình tỉnh Đồng Nai

12 90 4 29-04-2024

Xây dựng mô hình nuôi kết hợp tôm sú với hải sâm theo VietGAP cho một số tỉnh ven biển miền Trung

15 484 1 29-04-2024

Bài giảng An toàn thực phẩm: Chương 2 - Ô nhiễm sinh học

73 67 4 29-04-2024

First draft genome of Thecaphora frezii, causal agent of peanut smut disease

4 46 1 29-04-2024

Natural disaster insurance in Vietnam: A review

12 349 1 29-04-2024

A preliminary integrated genetic map distinguishes every chromosome pair and locates essential genes related to abiotic adaptation of Crassostrea angulata/gigas

12 47 1 29-04-2024

Kỹ năng lắng nghe thấu cảm của sinh viên khoa Tâm lý - Giáo dục, trường Đại học Sư phạm, Đại học Huế

7 393 2 29-04-2024

The effects of seasonal variations on household water security and burden of diarrheal diseases among under 5 children in an urban community, Southwest Nigeria

10 60 1 29-04-2024

Luận văn Thạc sĩ Kế toán: Các nhân tố ảnh hưởng đến mức độ công bố thông tin tự nguyện của các công ty niêm yết trên thị trường chứng khoán Việt Nam

137 313 2 29-04-2024

Luận văn Thạc sĩ Luật học: Kiểm soát hành vi lạm dụng vị trí thống lĩnh thị trường trong lĩnh vực kinh doanh xăng dầu

102 79 3 29-04-2024

Bài giảng môn Dược lý - Bài: Rối loạn lipid máu

31 101 1 29-04-2024

Giáo án môn Toán lớp 3 sách Chân trời sáng tạo - Tuần 8: Một phần hai, một phần ba, một phần tư, một phần năm

4 218 1 29-04-2024

Đề minh họa thi tốt nghiệp THPT năm 2022 môn Tiếng Trung Quốc - Bộ Giáo dục và Đào tạo

3 511 30 29-04-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24826 248

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40692 2394

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 2729 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 4997 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3299 100

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6586 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5640 718

Quản trị khủng hoảng trong quan hệ công chúng

2 3080 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4401 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4695 188