Vấn đề phân loại đa nhãn cho đồ thị

Bài viết đề xuất một phương pháp phân loại đa nhãn cho kiểu dữ liệu có thể biểu diễn dạng đồ thị chẳng hạn như các cấu trúc hóa học các thành phần thuốc tây bằng cách xây dựng một dàn giao khái niệm cho dữ liệu đồ thị đồng thời sử dụng luật Dempster-Shafer để tăng hiệu quả và độ chính xác phân loại đa nhãn đồ thị | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Hà Nội ngày 09-10 8 2018 DOI VẤN ĐỀ PHÂN LOẠI ĐA NHÃN CHO ĐỒ THỊ Hoàng Minh Quang1 Nguyễn Ngọc Cương2 1 Viện Công nghệ thông tin Viện Hàn lâm Khoa học và Công nghệ Việt Nam. 2 Cục Công nghệ thông tin - Bộ Công An. TÓM TẮT Học máy là lĩnh vực rất quan trọng trong khai phá dữ liệu đặc biệt trong bối cảnh dữ liệu ngày càng tăng nhanh chóng và kiểu dữ liệu ngày càng đa dạng do được thu thập từ nhiều nguồn thông tin khác nhau. Phân loại hay phân lớp dữ liệu là một kỹ thuật chính yếu trong lĩnh vực học máy. Với sự tăng trưởng dữ liệu nhanh chóng và đa dạng kiểu dữ liệu phân loại đa nhãn đang trở thành một xu thế mới do bản chất vấn đề phân loại dữ liệu thường là đa nhãn chẳng hạn như đối với âm thanh thì một bài nhạc có thể được phân vào nhiều nhãn cảm xúc đồng thời hay một hình ảnh có thể được phân vào nhiều nhãn đồng thời như động vật tự nhiên hoang dã . Tuy nhiên phân loại đa nhãn phải có một độ tin cậy nhất định vì một bức ảnh rộng chỉ chứa vài cây cỏ cũng có thể được phân vào nhãn hoang dã. Hầu hết các công trình phân loại đa nhãn đều áp dụng trên cấu trúc dữ liệu biểu diễn dạng vecto trong bài báo này chúng tôi đề xuất một phương pháp phân loại đa nhãn cho kiểu dữ liệu có thể biểu diễn dạng đồ thị chẳng hạn như các cấu trúc hoá học các thành phần thuốc tây bằng cách xây dựng một dàn giao khái niệm cho dữ liệu đồ thị đồng thời sử dụng luật Dempster-Shafer để tăng hiệu quả và độ chính xác phân loại đa nhãn đồ thị. Từ khóa Khai phá dữ liệu đồ thị con thường xuyên khai phá đồ thị phân loại đồ thị phân loại đa nhãn phân loại đa nhãn cho đồ thị. I. GIỚI THIỆU Học máy là lĩnh vực rất quan trọng trong khai phá dữ liệu đặc biệt là những dữ liệu rất lớn mà các thuật toán tìm kiếm chính xác không khả thi do độ phức tạp tính toán thuộc lớp NP-đầy đủ. Các dữ liệu ngày càng đa dạng về mặt cấu trúc các phương pháp khai phá dữ liệu trên bảng gặp nhiều khó .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.