Paraphrasing and Translation - part 1

Diễn giải và bản dịch trước đây đã được coi là nhiệm vụ xử lý ngôn ngữ tự nhiên không có liên quan. Trong khi đó, bản dịch đại diện cho việc bảo tồn có nghĩa là khi một ý tưởng là ra trong các từ trong một ngôn ngữ khác nhau, diễn giải đại diện cho việc bảo tồn có nghĩa là khi một ý tưởng được thể hiện bằng cách sử dụng các từ khác nhau trong cùng một ngôn ngữ | Paraphrasing and Translation Chris Callison-Burch Doctor of Philosophy Institute for Communicating and Collaborative Systems School of Informatics University of Edinburgh 2007 Abstract Paraphrasing and translation have previously been treated as unconnected natural language processing tasks. Whereas translation represents the preservation of meaning when an idea is rendered in the words in a different language paraphrasing represents the preservation of meaning when an idea is expressed using different words in the same language. We show that the two are intimately related. The major contributions of this thesis are as follows We define a novel technique for automatically generating paraphrases using bilingual parallel corpora which are more commonly used as training data for statistical models of translation. We show that paraphrases can be used to improve the quality of statistical machine translation by addressing the problem of coverage and introducing a degree of generalization into the models. We explore the topic of automatic evaluation of translation quality and show that the current standard evaluation methodology cannot be guaranteed to correlate with human judgments of translation quality. Whereas previous data-driven approaches to paraphrasing were dependent upon either data sources which were uncommon such as multiple translation of the same source text or language specific resources such as parsers our approach is able to harness more widely parallel corpora and can be applied to any language which has a parallel corpus. The technique was evaluated by replacing phrases with their paraphrases and asking judges whether the meaning of the original phrase was retained and whether the resulting sentence remained grammatical. Paraphrases extracted from a parallel corpus with manual alignments are judged to be accurate both meaningful and grammatical 75 of the time retaining the meaning of the original phrase 85 of the time. Using automatic alignments .

Bấm vào đây để xem trước nội dung
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.