Luận văn Thạc sĩ Kỹ thuật: Phân loại câu hỏi pháp quy tiếng Việt sử dụng mô hình BERT

Luận văn thực hiện mô hình hóa bài toán dưới dạng một bài toán phân lớp đa nhãn. Trong đó mỗi câu hỏi có thể thuộc một hoặc nhiều lĩnh vực khác nhau. Luận văn thực hiện phân loại câu hỏi sử dụng cách tiếp cận học máy giám sát, cụ thể là sử dụng một số mô hình truyền thống SVM và mô hình BERT[18, 6]. Kết quả thực nghiệm tốt nhất đạt được khi sử dụng mô hình BERT là 89,47% (độ đo F1). | HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG - NGUYỄN DIỆU LINH PHÂN LOẠI CÂU HỎI PHÁP QUY TIẾNG VIỆT SỬ DỤNG MÔ HÌNH BERT LUẬN VĂN THẠC SĨ KỸ THUẬT Theo định hướng ứng dụng HÀ NỘI 2021 HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG - NGUYỄN DIỆU LINH PHÂN LOẠI CÂU HỎI PHÁP QUY TIẾNG VIỆT SỬ DỤNG MÔ HÌNH BERT Chuyên ngành Khoa học máy tinh Mã số LUẬN VĂN THẠC SĨ KỸ THUẬT Theo định hướng ứng dụng NGƢỜI HƢỚNG DẪN KHOA HỌC PGS. TS. NGÔ XUÂN BÁCH HÀ NỘI 2021 i LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của bản thân. Các số liệu kết quả trình bày trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào trước đây. Tác giả Nguyễn Diệu Linh ii LỜI CẢM ƠN Em xin chân thành cảm ơn Xuân Bách bộ môn Khoa học máy tính Khoa Công nghệ thông tin đã tận tình chỉ dạy và hướng dẫn cho em trong việc lựa chọn đề tài thực hiện đề tài và viết báo cáo luận văn giúp cho em có thể hoàn thành tốt luận văn này. Em xin chân thành cảm ơn các thầy cô giáo Khoa Công nghệ thông tin là những người giảng dạy em đặc biệt các thầy cô trong khoa Sau đại học đã tận tình dạy dỗ và chỉ bảo em trong suốt 2 năm học . Em xin chân thành cảm ơn em Nguyễn Thị Minh Phương đã tham gia xây dựng kho ngữ liệu cho bài toán. Cuối cùng em xin cảm ơn gia đình bạn bè những người đã luôn bên cạnh động viên em những lúc khó khăn và giúp đỡ em trong suốt thời gian học tập và nghiên cứu tạo mọi điều kiện tốt nhất cho em để có thể hoàn thành tốt luận văn của mình. Mặc dù đã cố gắng hoàn thành nghiên cứu trong phạm vi và khả năng cho phép nhưng chắc chắn sẽ không tránh khỏi những thiếu sót. Em kính mong nhận được sự thông cảm của thầy cô và các bạn. Em xin chân thành cảm ơn Hà Nội 12 2020 Nguyễn Diệu Linh iii MỤC LỤC LỜI CAM ĐOAN . i LỜI CẢM ƠN .ii MỤC LỤC . iii DANH MỤC CÁC THUẬT NGỮ CHỮ VIẾT TẮT . v DANH MỤC HÌNH VẼ . vi DANH MỤC BẢNG BIỂU .vii MỞ ĐẦU . 1 CHƢƠNG 1 BÀI TOÁN PHÂN LOẠI CÂU HỎI . 4 Giới thiệu bài toán phân loại câu hỏi. 4 Đặc điểm dữ liệu câu hỏi .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
131    54    3    19-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.