Chuyển đổi cây cú pháp cụm danh từ tiếng Anh theo tiếng Việt

Bài viết đã trình bày mô hình chuyển đổi trật tự từ cụm danh từ cơ sở tiếng Anh theo tiếng Việt, để xác định điểm neo trong cụm danh từ tiếng Anh. Điểm neo trong bài toán này được định nghĩa là từ tận cùng bên trái và từ tận cùng bên phải của cụm danh từ tiếng Anh sau khi đã chuyển đổi trật tự từ theo tiếng Việt. | Chuyển đổi cây cú pháp cụm danh từ tiếng Anh theo tiếng Việt Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 9 (29), tháng 6/2013 Chuyển đổi cây cú pháp cụm danh từ tiếng Anh theo tiếng Việt Transferring Syntax Trees of English Noun Phrases via Vietnamese Syntax Nguyễn Chí Hiếu Abstract: Transferring syntax trees is one of the song ngữ vẫn còn là bài toán mở [4]. Bài báo này đề key tasks of machine translation systems. To transfer xuất một mô hình chuyển đổi cây phân tích cụm danh syntax trees, they can be performed by different từ cơ sở tiếng Anh theo tiếng Việt nhằm giải quyết models of the statistical translation method, rule- một số hạn chế của mô hình chiếu trên cơ sở đối sánh based translation method, or a hybrid of statistics and từ của Yarowsky [15] (sau này gọi là “phương pháp rule-based translation method [9]. In this paper we Yarowsky”) để nhận biết cụm danh từ tiếng Việt [5]. present a combination of bilingual corpus and Phương pháp Yarowsky cho phép các nước còn knowledge-based method, which transfers syntax trees thiếu nguồn tài nguyên về xử lý ngôn ngữ tự nhiên of English Base Noun Phrases via the Vietnamese (NLP) có thể thu được nhanh kết quả nghiên cứu syntax from a pair of bilingual sentences to identify thông qua một ngôn ngữ giàu tài nguyên nghiên cứu anchor points. Our combination technique can help to khác như tiếng Anh. Tuy nhiên hạn chế của phương invert word order in noun phrases of the source pháp Yarowsky là chưa giải quyết vấn đề đối sánh language to suit those of target language and improve rỗng, vấn đề chồng chéo và xung đột như ví dụ ở Hình the performance of miss-alignment, null-alignment, 1 và 2. overlap and conflict projection of the existing methods. The proposed technique can be easily applied to other language pairs. Experiment on pairs (a) n-1 và đối sánh (b) 1-n và đối sánh of sentences in the English-Vietnamese bilingual a buffalo rỗng the plane corpus .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.