Tìm kiếm câu hỏi có ý nghĩa từ các trang web hỏi đáp cộng đồng

Nghiên cứu thực hiện trích rút những đặc trưng quan trọng từ mỗi luồng hỏi - đáp cũng như thông tin của người sử dụng và xây dựng mô hình phân loại để xác định được những câu hỏi có ý nghĩa. Các thực nghiệm được xây dựng trên tập dữ liệu trích rút từ trang web hỏi đáp cộng đồng Yahoo! Answer đã chỉ ra tính hiệu quả của phương pháp đề xuất. | TẠP CHÍ KHOA HỌC Khoa học Tự nhiên và Công nghệ, Số 10 (9/2017) tr 104 - 113 TÌM KIẾM CÂU HỎI CÓ Ý NGHĨA TỪ CÁC TRANG WEB HỎI ĐÁP CỘNG ĐỒNG Nguyễn Văn Tú, Hoàng Thị Lam, Nguyễn Thị Thanh Hà13 Trường Đại học Tây Bắc Tóm tắt: Các trang web hỏi đáp cộng đồng có chứa một lượng lớn thông tin hỏi - đáp có giá trị sinh ra bởi những người sử dụng. Trong các trang web hỏi đáp cộng đồng, người dùng có thể gửi các câu hỏi, trả lời các câu hỏi của người khác và cung cấp thông tin phản hồi cho những câu hỏi/câu trả lời. Trong nghiên cứu này chúng tôi sử dụng tiếp cận học máy nhằm tìm kiếm những câu hỏi có ý nghĩa từ các trang web hỏi đáp cộng đồng. Những câu hỏi này cùng với các câu trả lời tốt nhất của chúng sẽ là nguồn dữ liệu quan trọng cho xây dựng cơ sở tri thức, truy hồi thông tin và hỏi đáp non - factiod. Nghiên cứu thực hiện trích rút những đặc trưng quan trọng từ mỗi luồng hỏi - đáp cũng như thông tin của người sử dụng và xây dựng mô hình phân loại để xác định được những câu hỏi có ý nghĩa. Các thực nghiệm được xây dựng trên tập dữ liệu trích rút từ trang web hỏi đáp cộng đồng Yahoo! Answer đã chỉ ra tính hiệu quả của phương pháp đề xuất của chúng tôi. Từ khóa: Hỏi đáp cộng đồng, hỏi đáp tự động, phân loại, support vector machine. 1. Tổng quan Trong lĩnh vực xử lý ngôn ngữ tự nhiên và truy xuất thông tin, vấn đề hỏi - đáp đã thu hút nhiều sự chú ý trong những năm qua. Tuy nhiên, các nghiên cứu về hỏi - đáp chủ yếu tập trung vào việc tìm câu trả lời chính xác cho câu hỏi factoid được trích rút từ các tài liệu liên quan. Đánh giá nổi tiếng nhất về nhiệm vụ hỏi - đáp factoid là hội nghị truy hồi văn bản (Text REtrieval Conference-TREC(1)). Các câu hỏi và câu trả lời được phát hành bởi TREC đã trở thành nguồn dữ liệu quan trọng cho các nhà nghiên cứu trong việc nghiên cứu xây dựng các hệ thống hỏi đáp tự động [10]. Tuy nhiên, khi phải đối mặt với các câu hỏi non - factoid như các câu hỏi về lý do tại sao, như thế nào, hầu như không có hệ thống hỏi đáp tự động nào làm .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.