Dóng hàng tự động mức từ cho song ngữ Anh - Việt sử dụng cách tiếp cận học sâu

Nghiên cứu đề suất hướng tiếp cận học sâu cho bài “Dóng hàng tự động ở mức từ” ở cặp song ngữ Việt - Anh. Kết quả nghiên cứu là mô hình được huấn luyện trên bộ ngữ liệu song ngữ Việt - Anh cặp cậu được dóng hàng thủ công. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR TP. HCM ngày 23-24 12 2021 DOI DÓNG HÀNG TỰ ĐỘNG MỨC TỪ CHO SONG NGỮ ANH - VIỆT SỬ DỤNG CÁCH TIẾP CẬN HỌC SÂU Lê Hoài Bảo1 Trịnh Vũ Minh Hùng1 Hoàng Khuê1 Lê Thanh Tùng2 1 Khoa Công nghệ thông tin Đại học Khoa học Tự nhiên Đại học Quốc gia Thành phố Hồ Chí Minh 2 Công an tỉnh Quảng Bình 1712049@ 17l2005@ hkhue@ tungleqb@ TÓM TẮT Ngày nay với lượng dữ liệu ngôn ngữ text voice khổng lồ từ internet đặt ra nhiều bài toán về Xử lý ngôn ngữ tự nhiên. Trong đó Dóng hàng tự động ở mức từ cho cặp song ngữ. Nó là một trong những bài toán cơ bản ảnh hưởng trực tiếp đến độ chính xác cũng như hiệu quả là đầu vào cho các bài toán còn lại như Dịch máy tự động tóm tắt văn bản gán nhãn từ loại của các bài toán khác. Tuy nhiên các hướng nghiên cứu Dóng hàng tự động ở mức từ cho cặp song ngữ Việt - Anh hầu như không có đột phá nào ngoài sử dụng các thành tựu của máy học thống kê mô hình IBM model 1-5 và mô hình HMM có nhiều hạn chế khi áp dụng trong nghiên cứu ngôn ngữ học. Do đó nhóm nghiên cứu đề suất hướng tiếp cận học sâu cho bài Dóng hàng tự động ở mức từ ở cặp song ngữ Việt - Anh. Kết quả nghiên cứu là mô hình được huấn luyện trên bộ ngữ liệu song ngữ Việt - Anh cặp cậu được dóng hàng thủ công. Chúng tôi hi vọng với mô hình đề xuất sẽ giúp ích cho những nhà ngôn ngữ học cũng có thể dễ dàng sử dụng học sâu khi nghiên cứu các đề tài liên quan đến ngôn ngữ học đối chiếu. Từ khóa Deep learning Word alignment Parallel corpus Web application. I. GIỚI THIỆU Bài toán Dóng hàng mức từ cho các cặp song ngữ đang được rất nhiều nhóm nghiên cứu trên thế giới thực hiện. Tuy nhiên hầu hết các nhóm đều dựa trên cách tiếp cận thống kê với nền tảng là mô hình IBM1-5 và HMM. Gần đây Deep Learning đã được áp dụng rất nhiều vào các bài toán Xử lý ngôn ngữ tự nhiên và cho ra kết quả rất cao ví dụ như áp .

Thùy Oanh 599 8 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

Mô hình toán - Giáo trình mô hình toán kinh tế

13 407 21

Báo cáo Mô hình hóa môi trường: Tổng quan về mô hình hóa các bước thiết lập và phát triển mô hình

26 320 2

Bài giảng Mô hình, mô hình hóa và mô hình hóa các quá trình môi trường

1 274 21

Mô hình hoá mô phỏng di tản thành mô hình tuyến tính dựa trên chuỗi Markov

5 107 2

Vận dụng phân tích mô hình vào một số mô hình kinh tế phổ biến

45 242 1

Luận văn: So Sánh hiệu quả kinh tế giữa mô hình luân canh lúa - khoai và mô hình luân canh lúa - bắp trên nền đất lúa ở huyện Bình Tân, tỉnh Vĩnh Long

60 201 4

Bài giảng Mô hình tài chính - Chương 1: Lập mô hình tài chính

14 389 24

Bài giảng Mô hình hóa môi trường: Chương 1 - GV. Trương Thị Thu Hương

12 502 19

Đề bài: Phân tích và so sánh 3 mô hình cung cấp dịch vụ tâm lý học trường học: Mô hình điều trị, mô hình sinh thái, mô hình sức khoẻ cộng đồng. Cho ví dụ minh họa?

2 157 1

Bài giảng Mô hình kinh tế lượng động: Mô hình tự hồi quy và mô hình phân phối trễ - Đinh Công Khải

21 236 10

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40664 2392

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24798 248

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24267 4267

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 19879 2838

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19382 1542

Bảng biến đổi Laplace và biến đổi Z

1 19127 612

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19099 2965

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 16020 2956

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 15731 326

Sự so sánh văn bản văn học và tác phẩm văn học

1 14447 131

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Persistent domestic circulation of African swine fever virus in Tanzania, 2015-2017

13 79 1 26-04-2024

Giáo trình Sản phẩm dầu mỏ (Nghề: Vận hành thiết bị chế biến dầu khí - Trung cấp) - Trường Cao Đẳng Dầu Khí

80 92 1 26-04-2024

Đánh giá đặc điểm lá sàng ở bệnh nhân glôcôm góc mở bằng kỹ thuật tăng cường chiều sâu trên OCT

5 50 1 26-04-2024

Đề thi giữa học kì 2 môn Sinh học lớp 12 năm 2022-2023 - Trường THPT số 2 Bảo Thắng

7 108 1 26-04-2024

Organizational behavior: Lecture 18 - Dr. Mukhtar Ahmed

49 101 2 26-04-2024

Bảng thanh toán tiền lương và các khoản phụ cấp theo lương, các khoản trích nộp theo lương (Mẫu số C02- HD)

2 85 1 26-04-2024

Thực tiễn thực thi tại Việt Nam quyền được chăm sóc sức khỏe theo quy định tại Công ước quốc tế các quyền kinh tế, xã hội và văn hóa 1966 (ICESCR)

9 712 1 26-04-2024

Tóm tắt Luận án Tiến sĩ Khoa học giáo dục: Dạy học môn Công nghệ dựa vào năng lực ở trường Trung học cơ sở

29 60 3 26-04-2024

Tóm tắt Luận án Tiến sĩ Tâm lý học: Thích ứng với tái hòa nhập cộng đồng của người chấp hành xong biện pháp xử lý hành chính đưa vào trường giáo dưỡng

29 353 1 26-04-2024

Biện pháp rèn luyện kỹ năng giao tiếp cho sinh viên lớp Tâm lý giáo dục 3 trường Đại học Sư phạm – Đại học Huế

7 322 7 26-04-2024

Đề thi giữa học kì 2 môn Địa lí lớp 12 năm 2020-2021 có đáp án - Trường THPT Thị xã Quảng Trị

5 68 1 26-04-2024

Giáo trình Sửa chữa hệ thống gạt mưa (Nghề Sửa chữa điện máy công trình – Trình độ trung cấp) – CĐ GTVT Trung ương I

22 165 7 26-04-2024

Luận văn Thạc sĩ Luật học: Pháp luật bảo hiểm y tế bắt buộc từ thực tiễn thi hành tại tỉnh Phú Thọ

94 65 2 26-04-2024

Đề cương ôn tập học kì 1 môn Sinh học lớp 12 năm 2022-2023 - Trường THPT Phúc Thọ

7 62 1 26-04-2024

Đề thi học sinh giỏi cấp huyện môn Toán lớp 7 năm 2021-2022 - Phòng GD&ĐT Hương Khê

4 61 1 26-04-2024

Luận văn Thạc sĩ Khoa học giáo dục: Quản lý hoạt động nghiên cứu khoa học của giảng viên trường Đại học Cửu Long

160 76 7 26-04-2024

Bài giảng Đồ họa kỹ thuật 2: Chương 1 - Trường ĐH Thủy Lợi

41 60 1 26-04-2024

Software design: Lecture 26 - Sheraz Pervaiz

18 86 2 26-04-2024

Reviewing abenomics and implications for Vietnam

15 68 1 26-04-2024

Sáng kiến kinh nghiệm: Một vài giải pháp thu hút bạn đọc đến thư viện

13 221 6 26-04-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24798 248

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40664 2392

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 2719 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 4990 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3287 100

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6581 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5636 718

Quản trị khủng hoảng trong quan hệ công chúng

2 3070 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4389 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4682 187

Đã phát hiện trình chặn quảng cáo AdBlock

Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.