Kỹ thuật và ứng dụng của khai thác văn bản

Bài viết "Kỹ thuật và ứng dụng của khai thác văn bản" thảo luận về ý tưởng chung về khai thác văn bản và so sánh các kỹ thuật của nó. Ngoài ra, bài viết còn thảo luận ngắn gọn về một số ứng dụng khai thác văn bản được sử dụng hiện tại và trong tương lai. | Journal of educational equipment Applied research Volume 2 Issue 297 September 2023 ISSN 1859 - 0810 Kỹ thuật và ứng dụng của khai thác văn bản Nguyễn Văn Quang ThS. Công nghệ thông tin Trường Đại học Hải phòng Received 30 7 2023 Accepted 7 8 2023 Published 14 8 2023 Abstract Text mining has become an exciting research field as it tries to discover valuable information ji om unstructured texls. The unstructured texts which contain vast amount of information cannot simply be used for further processing by computers. Therefore exact processing methods algorithms and techniques are vital in order to extract this valuable information which is completed by using text mining. In this paper we have discussed general idea of text mining and comparison of its techniques. In addition we briefly discuss a number of text mining applications which are used presently and in future. Keywords Retrieval Extraction Categorization Clustering Summarization. 1. Đặt vấn đề 2. Nội dung nghiên cứu Khai thác văn bản KTVB đã trở thành vùng Truy xuất thông tin Hệ thống truy xuất thông tin nghiên cứu quan trọng. Một số lượng rất lớn thông tin IR nổi tiếng nhất là các công cụ tìm kiếm của Google được lưu trữ ở những nơi khác nhau trong cấu trúc phi nhận dạng các tài liệu trên World Wide Web có liên cấu trúc. Khoảng 80 dữ liệu của thế giới ở dạng văn quan đến một tập hợp các từ nhất định. Nó được đo bản phi cấu trúc l . Văn bản phi cấu trúc này không lường như một phần mở rộng cho việc truy xuất tài thể được máy tính dễ dàng sử dụng để xử lý thêm. Vì liệu trong đó các tài liệu được trả về được xử lý để vậy cần có một số kỹ thuật hữu ích để trích xuất một trích xuất thông tin hữu ích quan trọng cho người dùng số thông tin quý giá từ văn bản phi cấu trúc. Những 3 . Do đó việc truy xuất tài liệu được theo sau bởi thông tin này sau đó được lưu trữ ở định dạng cơ sở giai đoạn tóm tắt văn bản tập trung vào truy vấn do dữ liệu văn bản chứa các trường có cấu trúc và một người dùng đặt ra hoặc giai .

Bấm vào đây để xem trước nội dung
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.