Nâng cao chất lượng nhận dạng tiếng nói tiếng Việt sử dụng mô hình ngôn ngữ Transformer-XL

Bài viết Nâng cao chất lượng nhận dạng tiếng nói tiếng Việt sử dụng mô hình ngôn ngữ Transformer-XL đánh giá hiệu quả của Transformer-XL với tiếng Việt cũng như việc áp dụng chúng vào một hệ thống nhận dạng tiếng nói. | Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN 978-604-82-2981-8 NÂNG CAO CHẤT LƯỢNG NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT SỬ DỤNG MÔ HÌNH NGÔN NGỮ TRANSFORMER-XL Nguyễn Quang Trung1 Đỗ Văn Hải2 1 Trung tâm Không gian Mạng Viettel 2 Trường Đại học Thủy lợi 1. GIỚI THIỆU CHUNG 2. PHƯƠNG PHÁP NGHIÊN CỨU Mô hình ngôn ngữ là một thành phần không thể thiếu trong một hệ thống nhận . Hệ thống nhận dạng tiếng nói. dạng tiếng nói hiện đại. Chúng giúp đưa ra Một hệ thống nhận dạng tiếng nói cơ bản được kết quả chính xác ngay cả khi người thường gồm các thành phần như hình dưới nói bị ngọng nhưng đôi khi cũng là nguyên nhân làm giảm độ chính xác không phản ánh được đúng phân bố xác suất của ngôn ngữ. Tuy đã được chứng minh hiệu quả so với mô hình n-gram truyền thống các mô hình ngôn ngữ dựa trên mạng nơ-ron vốn thường Hình 1. Hệ thống nhận dạng tiếng nói sử dụng mạng hồi quy RNN và biến thể đều Tại khối decoder hệ thống sẽ sử dụng một gặp phải những vấn đề cố hữu của mạng mô hình ngôn ngữ để đánh giá lại tất cả các RNN đó là giả thuyết đã nhận dạng được từ đầu ra của - Khó song song hóa. mô hình phát âm pronunciation model . Số - Tất cả nội dung được mã hóa vào một lượng giả thuyết này có thể lên tới hàng triệu véc-tơ duy nhất. chỉ với một câu nói do đó mô hình ngôn ngữ - Các từ trong câu có vai trò giống nhau thường được sử dụng là n-gram vì tốc độ tính đối với từ cần dự đoán do đó không thể hiện toán rất nhanh. Trong khối decoder sẽ là một hiệu quả nội dung của câu. lưới từ có dạng như sau Từ những nhược điểm trên hiện nay xu thật thế trên cộng đồng trí tuệ nhân tạo đang dần tiếc 2 rất 4 đẹp 5 chuyển sang sử dụng mô hình Transfomer 2 0 Thời 1 1 tiết 0 34 thật địp 3 thay thế cho RNN và đã chứng minh những hiệu quả nhất định. Bài báo này sẽ trình bày Hình 2. Đầu ra của hệ thống nhận dạng thử nghiệm của chúng tôi khi áp dụng mô tiếng nói hình Transformer-XL 1 - biến thể của mạng Kết quả nhận dạng được cuối cùng sẽ là Transformer vào một hệ thống nhận

Quang Huy 230 3 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 2 - Viện Công nghệ Thông tin và Truyền thông

20 19 2

Ngôn ngữ học tạo sinh của N. Chomsky: Mô hình ngôn ngữ thứ nhất

10 198 1

Ebook Quy luật ngôn ngữ (Quyển 1: Tính quy luật của bộ máy ngôn ngữ): Phần 1

116 288 14

Luận án Tiến sĩ Ngôn ngữ học: Từ ngữ chỉ bộ phận cơ thể người trong tục ngữ, ca dao tiếng Hán và tiếng Việt dưới góc nhìn ngôn ngữ học tri nhận

292 971 52

Bài giảng Các ngôn ngữ dữ liệu với mô hình quan hệ - Vũ Tuyết Trinh

45 61 0

Ngôn ngữ mô hình hóa thống nhất UML và ngôn ngữ đặc tả SDL

7 170 6

Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 6 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)

6 199 2

Bài giảng Phân tích thiết kế hướng đối tượng: Giới thiệu về ngôn ngữ mô hình hóa UML - Trương Ninh Thuận

43 189 11

Đánh giá độ khó của văn bản tiếng Việt sử dụng mô hình tiền huấn luyện kết hợp với các đặc trưng ngôn ngữ

7 89 1

Nâng cao chất lượng nhận dạng tiếng nói tiếng Việt sử dụng mô hình ngôn ngữ Transformer-XL

3 151 1

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40664 2392

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24798 248

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24267 4267

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 19879 2838

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19382 1542

Bảng biến đổi Laplace và biến đổi Z

1 19127 612

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19099 2965

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 16020 2956

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 15729 326

Sự so sánh văn bản văn học và tác phẩm văn học

1 14446 131

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Yếu tố ảnh hưởng đến sống thêm trên ung thư đại tràng không polyp giai đoạn II - III có đột biến gen KRAS

10 67 1 25-04-2024

Sáng kiến kinh nghiệm THPT: Một số phương pháp giải các bài toán về modul của số phức

24 248 4 25-04-2024

Nghị quyết 84/NQ-CP năm 2021

9 74 2 25-04-2024

Yêu cầu và kỹ năng cơ bản trong giảng dạy môn Giáo dục chính trị tài trường Cao đẳng Cộng đồng Hà Tây để thích ứng với chuyển đổi số trong giáo dục

8 628 5 25-04-2024

Kết quả điều trị dị tật hẹp hộp sọ bẩm sinh tại khoa Phẫu thuật tạo hình, Bệnh viện Việt Đức giai đoạn 2015-2021

5 59 2 25-04-2024

An investigation into the optimal wear time criteria necessary to reliably estimate physical activity and sedentary behaviour from ActiGraph wGT3X+ accelerometer data in older care home residents

14 59 1 25-04-2024

Bài giảng Thương mại di động - Chương 4: Bảo mật trong thương mại di động

23 744 10 25-04-2024

Features of movements of climbing perch Anabas testudineus in water flow and on land

11 53 2 25-04-2024

Đề thi học sinh giỏi môn GDCD lớp 9 năm 2020-2021 - Phòng GD&ĐT Phú Thọ

5 179 15 25-04-2024

Khảo sát hoạt chất sinh học và khả năng kháng oxy hóa của dịch chiết vỏ trái lựu (Punica granatum)

15 207 1 25-04-2024

Xác định đột biến gen GAA và đặc điểm di truyền của bệnh Pompe

7 105 1 25-04-2024

Nghiên cứu mức độ nhiễm ký sinh trùng Nematopsis sp. trên một số nhuyễn thể hai mảnh vỏ nuôi tại Quảng Ninh và đề xuất biện pháp phòng chống

13 64 1 25-04-2024

Increase histone acetylation during the first mitotic cell cycle improves preimplantation development and the quality of mouse embryos generated by round spermatid injection (ROSI)

8 44 1 25-04-2024

Luận văn Thạc sĩ Giáo dục học: Kiểm tra đánh giá theo định hướng phát triển năng lực học sinh trong dạy học lịch sử Việt Nam từ 1960 đến 1975 ở trường trung học phổ thông

148 105 5 25-04-2024

Giáo trình mô đun Kỹ năng giao tiếp hành chính (Nghề: Văn thư hành chính - Trình độ: Trung cấp) - Trường CĐ Kinh tế - Kỹ thuật Bạc Liêu

57 166 7 25-04-2024

Mẫu Bản cam kết về tuân thủ đầy đủ các yêu cầu điều kiện về phòng cháy chữa cháy, bảo vệ môi trường

2 266 2 25-04-2024

Luận án Tiến sĩ: Quản lý nhà nước đối với phát triển du lịch cộng đồng ở một số tỉnh vùng Tây Bắc, Việt Nam

163 509 14 25-04-2024

Quan sát dịch chuyển của băng dựa trên phân tích chuỗi ảnh lập thể theo thời gian

6 374 1 25-04-2024

Ebook Lịch sử ngành kiểm tra của Đảng bộ tỉnh Quảng Nam: Phần 1

100 282 1 25-04-2024

Ứng dụng mô hình QUEFTS trong ước đoán năng suất tiềm năng và hiệu quả hấp thu N, P, K cho cây lúa trên đất phù sa và đất phèn ở đồng bằng sông Cửu Long

10 275 1 25-04-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24798 248

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40664 2392

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 2719 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 4990 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3287 100

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6581 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5636 718

Quản trị khủng hoảng trong quan hệ công chúng

2 3070 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4389 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4682 187