Sử dụng thuật toán phân lớp FSVM rút trích thông tin văn bản trên internet

Bài viết đã sử dụng kỹ thuật rút trích thông tin tự động và phân loại văn bản bằng phương pháp SVM (Support vector machine), FSVM (Fuzzy SVM), kết hợp với phân loại đa lớp mờ. Kết quả ứng dụng của nghiên cứu dùng trong rút trích thông tin, thu thập tin tức của các website hành chính của các Sở, ban, ngành thành phố nhằm cung cấp cho người dân, doanh nghiệp các thông tin về chủ trương chính sách, thông tin của thành phố trong hoạt động hành chánh công. | Sử dụng thuật toán phân lớp FSVM rút trích thông tin văn bản trên Internet SỬ DỤNG THUẬT TOÁN PHÂN LỚP FSVM RÚT TRÍCH THÔNG TIN VĂN BẢN TRÊN INTERNET Vũ Thanh Nguyên Trương Nhật Quang TÓM TẮT Bài báo đã sử dụng kỹ thuật rút trích thông tin tự động và phân loại văn bản bằng phương pháp SVM Support vector machine FSVM Fuzzy SVM kết hợp với phân loại đa lớp mờ. Kết quả ứng dụng của nghiên cứu dùng trong rút trích thông tin thu thập tin tức của các website hành chính của các Sở ban ngành thành phố nhằm cung cấp cho người dân doanh nghiệp các thông tin về chủ trương chính sách thông tin của thành phố trong hoạt động hành chánh công. ABSTRACT This paper is used automatically to extract information and classify texts by SVM method FSVM method with fuzzy multiclass classification. This research result is used to collect information from admin webpage of local goverment departments offices for providing citizens companies about news of HCM city goverment policy needed information for operating public admin. I. GIỚI THIỆU Hiện đã có một số nghiên cứu về rút trích văn bản và phân loại văn bản trong bài báo này nhóm nghiên cứu tìm hiểu các kỹ thuật trên và áp dụng vào một ứng dụng thực tế là thu thập và phân loại thông tin trên các trang báo điện tử phục vụ cho việc cung cấp tin tức trên các trang web hành chính thành phố. Các thông tin này có thể do các cơ quan tự cung cấp hoặc thu thập được trên các trang web của Bộ Chính phủ và các trang báo điện tử khác. Phần thu thập thông tin sử dụng phương pháp nhận dạng mẫu 2 9 11 để có thể tự động rút trích thông tin từ các trang web tin tức. Phần phân loại thông tin tác giả sử dụng kỹ thuật phân loại văn bản Fuzzy Support Vector Machines FSVMs 12 kết hợp với phân loại đa lớp mờ 5 do kết quả phân loại rất tốt của phương pháp này theo các đề tài đã nghiên cứu 1 5 8 12 . Sơ đồ thực hiện gồm hai bước chính là thu thập thông tin và phân loại thông tin cụ thể như sau Hình 1. Sơ đồ thực hiện 64 Tạp chí Khoa học Giáo dục Kỹ thuật số 7 1 .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.