Kỹ thuật làm tăng dữ liệu trong phân tích cảm xúc trên ngôn ngữ tiếng Việt

Trong nghiên cứu này đề xuất một mô hình làm tăng dữ liệu văn bản dựa trên các câu bình luận áp dụng cho ngôn ngữ tiếng Việt. Một số kỹ thuật cơ bản được sử dụng nhằm sinh thêm số lượng bình luận như chèn từ, thay thế từ, xóa từ. Kết quả thực nghiệm đã cho thấy hiệu quả của mô hình này. | 20 Hồ Hướng Thiên. HCMCOUJS-Kỹ thuật và Công nghệ 17 1 20-27 Kỹ thuật làm tăng dữ liệu trong phân tích cảm xúc trên ngôn ngữ tiếng Việt Text data augmentation techniques for sentiment analysis based on Vietnamese language Hồ Hướng Thiên1 1 Trường Đại học Đại học Mở Thành phố Hồ Chí Minh Việt Nam Tác giả liên hệ Email THÔNG TIN TÓM TẮT DOI HCMCOUJS. Những bình luận phản hồi trong các hệ thống trực tuyến là một nguồn dữ liệu mang nhiều thông tin cảm xúc của khách hàng về những sản phẩm hoặc dịch vụ. Những thông tin này được khai thác nhằm đem lại những ích lợi trong việc hoạch định chiến lược quản trị khách hàng. Để đạt được những kết quả tốt đối với mô hình phân Ngày nhận 04 03 2022 tích cảm xúc đòi hỏi một lượng lớn dữ liệu được gán nhãn. Chi phí cho việc gán nhãn dữ liệu huấn luyện bởi con người là rất lớn. Ngày nhận lại 15 04 2022 Trong nghiên cứu này chúng tôi đề xuất một mô hình làm tăng dữ Duyệt đăng 18 04 2022 liệu văn bản dựa trên các câu bình luận áp dụng cho ngôn ngữ tiếng Việt. Một số kỹ thuật cơ bản được sử dụng nhằm sinh thêm số lượng bình luận như chèn từ thay thế từ xóa từ. Kết quả thực nghiệm đã cho thấy hiệu quả của mô hình này. Từ khóa đánh giá sản phẩm khai thác ABSTRACT văn bản kỹ thuật tăng dữ liệu Comments from online system are used as a data source that phân tích cảm xúc xử lý ngôn ngữ tự nhiên exist in relevant information about customer sentiment. These include sentiments toward a product or service. This is useful for making a specific decision for customers and management. In order to building a high accuracy prediction model it requires Keywords much more labeled data. In this paper we have investigated a product comments text mining simple approach for augmenting text data based on Vietnamese text data augmentation language comments. Four basic techniques are used to generate sentiment analysis natural more new sentences such as random insertion random swap word language processing .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.