Trong bài báo này, chúng tôi sẽ trình bày phương pháp khắc phục lỗi dịch sai nói trên bằng cách phân loại cấu trúc nói trên thành các loại khác nhau dựa vào thông tin về cú pháp, ngữ nghĩa của chúng để từ đó chúng tôi tiến hành biến đổi từ, đảo trật tự từ cho phù hợp với dịch tự động từ tiếng Hoa sang tiếng Việt. | TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM SỐ 01 THÁNG 10 NĂM 2013 KHỬ MƠ HỒ NGHĨ CỦA CẤU TR C “之前/之后 ” TRONG DỊCH TỰ ĐỘNG HOA – VIỆT Trần Thanh Phƣớc, Trần Văn Thọ* TÓM TẮT Cấu trúc “之前/之后”là dạng ngữ pháp thƣờng gặp trong tiếng Hoa ở cả văn nói và văn viết. Trong dịch tự động thống kê Hoa – Việt, các hệ thống dịch máy thƣờng dịch sai ngữ nghĩa và trật tự từ của cấu trúc ngữ pháp này. Trong bài báo này, chúng tôi sẽ trình bày phƣơng pháp khắc phục lỗi dịch sai nói trên bằng cách phân loại cấu trúc nói trên thành các loại khác nhau dựa vào thông tin về cú pháp, ngữ nghĩa của chúng để từ đó chúng tôi tiến hành biến đổi từ, đảo trật tự từ cho phù hợp với dịch tự động từ tiếng Hoa sang tiếng Việt. Chúng tôi đã thực nghiệm phƣơng pháp này trên ngữ liệu song ngữ Hoa-Việt gồm cặp câu, từ điển Hoa-Việt gồm mục từ, từ điển từ loại động từ tiếng Hoa, từ điển từ loại thời gian của tiếng Hoa và kết quả điểm BLEU dịch Hoa-Việt đạt đƣợc là 47,23 so với 14,15 của Google Translator cho những câu tiếng Hoa có chứa cấu trúc này. ABSTRACT Structure “之前/之后” iscommongrammaticalforminChinese forbothspokenand written. InChineseVietnamese SMT (Statistical Machine Translation), themachine translationsystemsusuallymistranslate about semanticand word orderofthisgrammatical structure. In this paper, we will present a methodto fixthe abovewrong translation by being basedon their syntax and semantic information, we classifythemintodifferent types;and thenweconduct to convert word, reorder wordto be suitable to themachine translationfromChineseinto Vietnamese. We experimented this problem on the 10,000 pairs of Chinese-Vietnamese parallel corpus and 80,000-entry Chinese Vietnamese Dictionary, Chinese verb Dictionary, Chinese time Dictionary and we reach the result of BLEU score in comparison of BLEU of Google Translator forChinesesentencescontainingthese structures. 1. GIỚI THIỆU Đến nay, dịch tự động Hoa-Việt hay ViệtHoa chƣa thấy công bố chính thức ngoại .