Nghiên cứu này đề xuất một phương pháp mới là phương pháp gán trọng số động (Dynamic Classweight) nhằm mong muốn tạo nên một mô hình có khả năng thích nghi và không phụ thuộc vào tỷ lệ các lớp, hay là sự mất cân bằng dữ liệu | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Nha Trang ngày 8-9 10 2020 DOI XỬ LÝ MẤT CÂN BẰNG DỮ LIỆU TRONG PHÂN LOẠI TỔN THƯƠNG DA TRÊN ẢNH SOI DA Võ Minh Thiện1 Lê Minh Hưng1 Trần Kim Tâm2 Trần Văn Lăng3 1 Trƣờng ĐH Công nghệ Thông tin - ĐHQG TP. HCM 2 Trƣờng Đại học Giao thông Vận tải TP. HCM 3 Viện Hàn lâm Khoa học và Công nghệ Việt Nam 16521170@ hunglm@ langtv@ TÓM TẮT Ung thư hắc tố là một bệnh lý ác tính về da có khả năng di căn đến các cơ quan khác và tiên lượng rất nặng nếu chẩn đoán muộn. Ở giai đoạn sớm các tổn thương ác tính này rất dễ nhầm lẫn với nốt ruồi lành tính nếu chỉ thăm khám bằng mắt thường. Để khắc phục thực trạng này máy soi da - một thiết bị quang học đã được sử dụng tại các bệnh viện da liễu để hỗ trợ các bác sĩ trong thăm khám các lớp nông của da với độ phóng đại lớn đồng thời kết hợp với một hệ thống chụp và lưu trữ hình ảnh. Cuộc thi International Skin Image Collaboration 2018 ISIC2018 được tổ chức với nhiệm vụ phân loại ảnh tổn thương da để phát hiện sớm các bệnh lý nhất là ung thư ác tính. Dữ liệu bao gồm 10 015 ảnh soi da của 7 loại bệnh tổn thương. Vấn đề chính đặt ra của bài toán này là việc mất cân bằng dữ liệu nghiêm trọng khi chênh lệch giữa lớp nhiều nhất và lớp ít nhất lên đến 60 lần. Để giải quyết bài toán đặt ra trong nghiên cứu này chúng tôi tiến hành thực hiện tinh chỉnh thông số có sẵn các mạng nơron tích chập sâu Deep Convolutional Neural Network - DCNN hiện đại có thể kể đến như Inception DenseNet. Với vấn đề mất cân bằng dữ liệu nghiên cứu này đã thực nghiệm và so sánh các phương pháp phổ biến như cân bằng batch gán trọng số trên lớp. Bên cạnh đó nghiên cứu còn áp dụng một hàm mất mát đã mang lại những kết quả cải tiến đáng kể trong các bài toán phân loại ảnh là Large Margin Cosine Loss CosFace để có thể phân loại đặc trưng các lớp tốt hơn. Đặc biệt trong nghiên cứu này đề xuất một .