Phân loại ảnh đa nhãn với đối tượng mới từ tập dữ liệu đơn nhãn dựa trên mô hình conformer mặt nạ

Bài viết "Phân loại ảnh đa nhãn với đối tượng mới từ tập dữ liệu đơn nhãn dựa trên mô hình conformer mặt nạ" đề xuất mô hình Conformer và phương pháp mặt nạ tựa BERT cho phân loại ảnh đa nhãn dựa trên tập dữ liệu đơn nhãn ImageNet và tập dữ liệu đa nhãn Coco. ImageNet được sử dụng để huấn luyện nhận dạng đối tượng “chính” trong ảnh (đối tượng ImageNet) và Coco để nhận dạng các đối tượng “phụ” khác trong ảnh. | PHÂN LOẠI ẢNH ĐA NHÃN VỚI ĐỐI TƯỢNG MỚI TỪ TẬP DỮ LIỆU ĐƠN NHÃN DỰA TRÊN MÔ HÌNH CONFORMER MẶT NẠ Nghiêm Văn Triệu1 Ngô Quốc Tạo2 1 Tổng công ty Viễn thông Mobifone 2 Viện Công nghệ thông tin Viện Hàn lâm Khoa học và Công nghệ Việt Nam Email nghiemvantrieu@ Ngày nhận bài 23 02 2023 Ngày nhận bài sửa sau phản biện 25 03 2023 Ngày chấp nhận đăng 28 03 2023 TÓM TẮT Mô hình Convolutional Neural Network và gần đây là Transformer đã chứng minh hiệu quả trong phân loại ảnh đơn nhãn dựa trên các tập dữ liệu đơn nhãn. Khi mở rộng ra bài toán phân loại ảnh đa nhãn một rào cản lớn là không đủ các tập dữ liệu đa nhãn cho huấn luyện mô hình. Kết hợp trực tiếp tập ảnh đa nhãn và đơn nhãn cho đối tượng mới chưa mang lại kết quả phân loại đa nhãn. Trong bài báo này chúng tôi đề xuất mô hình Conformer và phương pháp mặt nạ tựa BERT cho phân loại ảnh đa nhãn dựa trên tập dữ liệu đơn nhãn ImageNet và tập dữ liệu đa nhãn Coco. ImageNet được sử dụng để huấn luyện nhận dạng đối tượng chính trong ảnh đối tượng ImageNet và Coco để nhận dạng các đối tượng phụ khác trong ảnh. Kết hợp một lượng nhỏ dữ liệu ngữ cảnh đa nhãn là sự lai ghép đối tượng từ Coco và ImageNet để kết nối các tập dữ liệu khác nhau mô hình đề xuất có thể nhận dạng đối tượng chính trong ảnh và các đối tượng thông thường khác. Ngoài ra mô hình có thể áp dụng cho gán lại đa nhãn tập dữ liệu ImageNet với thông tin ngữ cảnh đặc trưng. Từ khóa gán lại đa nhãn tập ImageNet mô hình Conformer phân loại ảnh đa nhãn tập dữ liệu đơn nhãn tập dữ liệu ImageNet. MULTI-LABEL IMAGE CLASSIFICATION WITH NOVEL OBJECT FROM SINGLE-LABEL DATASET BY MASK CONFORMER MODEL ABSTRACT On the basis of single-label datasets the Convolutional Neural Network CNN and more recently the Transformer model have shown to be successful at classifying single-label images. The lack of multi-label datasets for model training is a significant obstacle when it comes to the problem of multi-label image classification. In this paper we propose a Conformer .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
63    72    5    29-04-2024
44    299    1    29-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.