Bài viết tiến hành thực nghiệm lại một phương pháp đánh giá tính dễ đọc của văn bản dựa trên bộ từ điển ngữ nghĩa WordNet cho tiếng Anh và tiến hành một số thay đổi để thực nghiệm trên bộ WordNet tiếng Việt. Những kết quả đạt được cho thấy đây là một phương pháp tiềm năng và có thể sử dụng làm cơ sở cho các nghiên cứu sau này về đánh giá tính dễ đọc văn bản cho tiếng Việt. | Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR 9 Cần Thơ ngày 4-5 8 2016 DOI ĐÁNH GIÁ TÍNH DỄ ĐỌC CỦA VĂN BẢN TIẾNG VIỆT DỰA TRÊN WORDNET Phạm Duy Tâm Trần Minh Hùng Lƣơng An Vinh Đinh Điền Trung tâm Ngôn ngữ học Tính toán - Trường ĐH Khoa học Tự nhiên Tp. Hồ Chí Minh 1212346@ 1212157@ anvinhluong@ ddien@ TÓM TẮT Tính dễ đọc của một văn bản là tổng hợp các yếu tố của văn bản tác động tới khả năng đọc và hiểu hoàn toàn nội dung của văn bản. Việc đánh giá tính dễ đọc có vai trò rất lớn trong quá trình soạn thảo văn bản nhằm xác định đúng đối tượng độc giả muốn hướng đến. Những nghiên cứu về tính dễ đọc của văn bản đã được thực hiện từ lâu trên thế giới nhưng chủ yếu là cho tiếng Anh và một số ngôn ngữ phổ biến khác Đối với tiếng Việt đã có 2 công trình nghiên cứu về vấn đề này nhưng chỉ thực hiện trên các đặc trưng bề mặt của ngôn ngữ như độ dài từ độ dài câu Trong bài báo này chúng tôi tiến hành thực nghiệm lại một phương pháp đánh giá tính dễ đọc của văn bản dựa trên bộ từ điển ngữ nghĩa WordNet cho tiếng Anh và tiến hành một số thay đổi để thực nghiệm trên bộ WordNet tiếng Việt. Những kết quả đạt được cho thấy đây là một phương pháp tiềm năng và có thể sử dụng làm cơ sở cho các nghiên cứu sau này về đánh giá tính dễ đọc văn bản cho tiếng Việt. Từ khóa Tính dễ đọc của văn bản text readablity từ điển ngữ nghĩa WordNet. I. GIỚI THIỆU Tính dễ đọc của văn bản text readability theo định nghĩa của Edgar Dale và Jeanne Chall 1949 7 là tổng hợp các yếu tố của một văn bản ảnh hưởng đến sự thành công của một nhóm người đọc văn bản đó. Sự thành công ở đây là mức độ họ hiểu văn bản đó đọc nó với một tốc độ tối ưu và cảm thấy thích thú khi đọc văn bản đó . Tính dễ đọc thường nhầm lẫn với tính dễ nhìn legibility của văn bản là mức độ dễ dàng đọc của một văn bản dựa trên các yếu tố như kiểu chữ kích cỡ chữ khoảng cách dòng . Tính dễ đọc .