Tăng cường dữ liệu để cải thiện hiệu suất mô hình phân lớp trong trường hợp một số lớp có rất ít mẫu là một thử thách trong các bài toán phân loại ảnh, đặc biệt là trong lĩnh vực y khoa đối với một số bệnh lý hiếm gặp hoặc đột biến. Sử dụng Generative Adversarial Networks (GANs) để tăng cường dữ liệu trong trường hợp này thường không đạt hiệu suất cao ở những lớp thiểu số. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Nha Trang ngày 8-9 10 2020 DOI TĂNG CƯỜNG DỮ LIỆU ẢNH CHO BỘ DỮ LIỆU X-QUANG PHỔI SỬ DỤNG MẠNG SINH ĐỐI NGHỊCH Trần Hoàng Phát1 Phạm Mạnh Cường1 Trần Đình Toàn2 Hoàng Tùng3 Lê Minh Hưng1 1 Trường Đại học Công nghệ thông tin - Đại học Quốc gia 2 Trường Đại học Công nghiệp Thực phẩm 3 Trung tâm CNTT Trường Đại học Nguyễn Tất Thành 16520918@ 16520156@ toantd@ htung@ hunglm@ TÓM TẮT Tăng cường dữ liệu để cải thiện hiệu suất mô hình phân lớp trong trường hợp một số lớp có rất ít mẫu là một thử thách trong các bài toán phân loại ảnh đặc biệt là trong lĩnh vực y khoa đối với một số bệnh lý hiếm gặp hoặc đột biến. Sử dụng Generative Adversarial Networks GANs để tăng cường dữ liệu trong trường hợp này thường không đạt hiệu suất cao ở những lớp thiểu số. Xem xét bài toán phân loại ảnh X-quang lồng ngực chúng tôi xây dựng mô hình feature based X-ray GAN FX- GAN để tổng hợp dữ liệu ảnh X-quang với hướng tiếp cận học từ phân phối đặc trưng. Mô hình học cách sử dụng những đặc trưng được cung cấp để tạo ra ảnh mới mang đặc trưng tương tự. Trong đó đặc trưng được trích xuất từ một mô hình độ đo đã được huấn luyện có thể trích xuất những đặc trưng phân biệt giữa các lớp. Khi mô hình độ đo khái quát được những lớp không được quan sát mô hình của nghiên cứu này có thể tạo dữ liệu cho những lớp đó mà không cần thực hiện tinh chỉnh. Tiến hành thực nghiệm FX-GAN trên bộ dữ liệu ảnh X-quang lồng ngực và đánh giá khả năng tăng cường dữ liệu cho những lớp thiểu số nằm ngoài tập quan sát chỉ dựa vào một vài mẫu dữ liệu có sẵn đồng thời cải thiện hiệu suất của mô hình phân loại bệnh lý qua ảnh X-quang lồng ngực. Từ khóa One-shot image generation Generative adversarial network Chest X-ray classification Data augmentation. I. GIỚI THIỆU Phân loại ảnh X-quang lồng ngực để phát hiện các bệnh lý là một