Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Nhận dạng thực thể định danh từ văn bản ngắn Tiếng Việt và đánh giá thực nghiệm

Mục tiêu chính của luận văn là xây dựng mô hình nhận dạng thực thể định danh cho văn bản ngắn Tiếng Việt. Kết hợp với việc áp dụng học suốt đời nhằm khắc phục những khó khăn gặp phải do đặc điểm của văn bản Tiếng Việt nói chung và văn bản ngắn nói riêng. Sau đó tiến hành thực nghiệm nhằm đánh giá hiệu quả của phương pháp áp dụng mới | ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM THỊ THU TRANG NHẬN DẠNG THỰC THỂ ĐỊNH DANH TỪ VĂN BẢN NGẮN TIẾNG VIỆT VÀ ĐÁNH GIÁ THỰC NGHIỆM Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Hà Nội – 2018 PHẦN MỞ ĐẦU 1. Tính cấp thiết của luận văn Nhận dạng thực thể định danh là một cầu nối quan trọng trong việc kết nối dữ liệu có cấu trúc và dữ liệu phi cấu trúc. Nó cũng có rất nhiều ứng dụng như: xây dựng máy tìm kiếm thực thể, tóm tắt văn bản, tự động đánh chỉ số cho các sách, bước tiền xử lí làm đơn giản hóa các bài toán dịch máy, Bên cạnh đó, việc bùng nổ của các mạng xã hội như Facebook, Twitter, và các hệ thống hỏi đáp đã mang lại một lượng thông tin khổng lồ. Đặc điểm của các dữ liệu đó thường là các văn bản ngắn, từ ngữ được sử dụng thường là văn nói và liên quan đến nhiều miền dữ liệu khác nhau. Chính đặc điểm này đã mang lại nhiều khó khăn khi áp dụng bài toán nhận dạng thực thể định danh. Khi gặp phải một vấn đề mới, chúng ta thường giải quyết nó dựa vào những tri thức, kinh nghiệm có trước. Ví dụ như: khi giải một bài toán ta thường liên hệ để đưa chúng về các dạng bài trước đây đã làm hoặc tìm sự tương đồng giữa chúng. Việc áp dụng những tri thức này thường làm tăng tốc độ cũng như chất lượng của việc học. Nhận xét này không chỉ liên quan đến việc học của con người mà còn liên quan đến học máy. Việc học trong một nhiệm vụ mới được cải thiện bằng việc sử tri thức đã được lưu lại từ những nhiệm vụ học trước đó. Nói cách khác là ta sử dụng những tri thức đã có nhằm nâng cao hiệu quả của việc học cho nhiệm vụ mới. Ý thức được tầm quan trọng của bài toán nhận dạng thực thể cũng như ý nghĩa của học suốt đời, em đã chọn đề tài nhận dạng thực thể định danh từ văn bản ngắn tiếng Việt và đánh giá thực nghiệm. Đối với luận văn này, em sẽ tìm hiểu áp dụng thực nghiệm nhận dạng thực thể trong văn bản ngắn Tiếng Việt với mô hình CRFs áp dụng học suốt đời. 2. Mục tiêu của luận .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.