Trích xuất thực thể trong an toàn thông tin sử dụng học sâu

Bài viết Trích xuất thực thể trong an toàn thông tin sử dụng học sâu trình bày một phương pháp trích xuất thực thể có tên trong an toàn thông tin sử dụng các kỹ thuật học sâu, là mô hình kết hợp gồm word2vec, BERT, BiLSTM và CRF. | Nguyễn Ngọc Điệp Nguyễn Thị Thanh Thủy TRÍCH XUẤT THỰC THỂ TRONG AN TOÀN THÔNG TIN SỬ DỤNG HỌC SÂU Nguyễn Ngọc Điệp Nguyễn Thị Thanh Thủy Học viện Công nghệ Bưu chính Viễn thông Tóm tắt Hiện nay với sự gia tăng nhanh chóng của các tạp và đa dạng của văn bản trong lĩnh vực này việc xác nguồn tài liệu liên quan đến lĩnh vực an toàn thông tin việc định các thực thể này là một công việc có nhiều thách thức. trích xuất tự động các thông tin quan trọng từ các nguồn Về cơ bản việc xác định các thực thể trong an toàn thông tài liệu này là một nhu cầu cấp thiết. Một trong những loại tin là bài toán nhận dạng thực thể có tên NER trong xử lý thông tin phổ biến cần trích xuất đó là các thực thể có tên ngôn ngữ tự nhiên. Các thực thể có thể là chương trình phần như tên chương trình phần mềm tin tặc chương trình mã mềm thiết bị công nghệ tin tặc hay chương trình độc hại độc lỗ hổng công nghệ các kỹ thuật . Tuy nhiên do tính lỗ hổng CVE . Một trong các phương pháp tiếp cận phức tạp đa dạng có nhiều đặc trưng về chuyên ngành ban đầu nhanh chóng và hiệu quả để nhận dạng các thực riêng của các nguồn tài liệu này việc xác định các thực thể thể này là dựa trên luật. Các phương pháp dựa trên luật có có tên hiện còn gặp rất nhiều khó khăn. Gần đây có một thể trích xuất các thực thể theo mẫu như email địa chỉ IP số phương pháp tiếp cận để giải quyết bài toán này trong hay các lỗ hổng phổ biến hoặc dựa vào tập từ điển để nhận đó nổi trội hơn là các phương pháp dựa trên học sâu là các dạng ra các thực thể đã biết. Tuy nhiên phương pháp này kỹ thuật tiên tiến nhất được sử dụng nhiều trong lĩnh vực không phù hợp đối với các trường hợp phức tạp của văn trích xuất thông tin. Trong bài báo này chúng tôi trình bày bản an toàn thông tin với cấu trúc văn bản không theo quy một phương pháp trích xuất thực thể có tên trong an toàn tắc thông thường xuất hiện nhiều thực thể có tên mới đồng thông tin sử dụng các kỹ thuật học sâu là mô hình kết hợp thời yêu cầu chi phí cao về cả thời gian con người

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
61    71    1    01-05-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.