Nghiên cứu thu thập và xây dựng cơ sở dữ liệu chữ viết tắt tiếng Việt

Bài viết Nghiên cứu thu thập và xây dựng cơ sở dữ liệu chữ viết tắt tiếng Việt tập trung nghiên cứu thu thập tự động và xây dựng một cơ sở dữ liệu tương đối đầy đủ về chữ viết tắt tiếng Việt. Trên cơ sở đó, chúng tôi sẽ tiến đến xây dựng một hệ thống quản lý và tra cứu chữ viết tắt tiếng Việt trực tuyến nhằm đáp ứng nhu cầu của đông đảo người sử dụng. | TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG - SỐ 7 80 .2014 125 NGHIÊN CỨU THU THẬP VÀ XÂY DỰNG CƠ SỞ DỮ LIỆU CHỮ VIẾT TẮT TIẾNG VIỆT COLLECTING AND BUILDING AN VIETNAMESE ABBREVIATION DATABASE Huỳnh Công Pháp1 Nguyễn Văn Huệ2 Đại học Đà Nẵng Email hcphap@ 1 2 Công ty phần mềm Enclave Email nguyenhuebkdn@ Tóm tắt - Chữ viết tắt trong tiếng Việt ngày càng tăng lên đáng kể Abstract - Vietnamese abbreviations increase very fast diversify về số lượng đa dạng về ký hiệu nhiều chữ viết tắt có nhiều nghĩa in forms and some of them have multiple meanings. This poses a khác nhau. Điều này đã dẫn đến một thực trạng là làm cho người problem for readers to recognize abbreviations or to understand đọc văn bản nhiều lúc hiểu nhầm nội dung hoặc khó có thể đoán ra the relevant meaning in some situation. However we currently được nghĩa của từ viết tắt. Tuy nhiên hiện nay chúng ta vẫn chưa can t still find out a system of vietnamese abbreviation consultation. tìm thấy một hệ thống tra cứu chữ viết tắt tiếng Việt. Để xây dựng To have such a system the first step we should build a vietnamese được hệ thống tra cứu chữ viết tắt cũng như công cụ hỗ trợ gõ tắt abbreviation database. In this paper we focus on the research of bước đầu tiên là cần phải xây dựng được cơ sở dữ liệu chữ viết tắt acquiring vietnamese abbreviations from documents and the tiếng Việt. Trong bài báo này chúng tôi tập trung nghiên cứu thu thập internet to build an abbreviation database. From this database we tự động và xây dựng một cơ sở dữ liệu tương đối đầy đủ về chữ viết aim to propose an online system of abbreviation management and tắt tiếng Việt. Trên cơ sở đó chúng tôi sẽ tiến đến xây dựng một hệ consultation as well as a hooked software like Vietkey thống quản lý và tra cứu chữ viết tắt tiếng Việt trực tuyến nhằm đáp supporting autotext when typing. ứng nhu cầu của đông đảo người sử dụng. Bên cạnh đó cũng từ cơ sở dữ liệu này chúng tôi cũng sẽ tiến hành nghiên cứu xây dựng một công cụ tích

Bấm vào đây để xem trước nội dung
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.