Đóng góp của đặc trưng văn bản trong bài toán phân lớp ảnh

Bài viết đề xuất phương pháp phân lớp ảnh kết hợp các bộ phân lớp dựa trên đặc trưng ảnh và đặc trưng văn bản ở bộ phân lớp thứ ba sử dụng giải thuật hồi quy logistic. Đặc trưng văn bản sẽ được xây dựng dựa trên các văn bản đi kèm với ảnh, các bức ảnh này là ảnh láng giềng gần nhất với ảnh đầu vào trong tập ảnh chuẩn. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Hà Nội ngày 09-10 8 2018 DOI ĐÓNG GÓP CỦA ĐẶC TRƯNG VĂN BẢN TRONG BÀI TOÁN PHÂN LỚP ẢNH Hà Thị Phương Anh1 Phạm Thế Phi2 Đỗ Thanh Nghị2 1 Khoa Công nghệ thông tin Trường Đại học Bạc Liêu 2 Khoa Công nghệ thông tin amp Truyền thông Trường Đại học Cần Thơ htpanh52@ ptphi@ dtnghi@ TÓM TẮT Trong bài viết này chúng tôi đề xuất phương pháp phân lớp ảnh kết hợp các bộ phân lớp dựa trên đặc trưng ảnh và đặc trưng văn bản ở bộ phân lớp thứ ba sử dụng giải thuật hồi quy logistic. Đặc trưng văn bản sẽ được xây dựng dựa trên các văn bản đi kèm với ảnh các bức ảnh này là ảnh láng giềng gần nhất với ảnh đầu vào trong tập ảnh chuẩn. Các đặc trưng ảnh được trích chọn với các phương pháp khác nhau để xác định phương pháp phù hợp nhất. Kết quả thực nghiệm trên tập dữ liệu hình ảnh di sản văn hóa phi vật thể cho thấy phương pháp được đề xuất đã cải thiện được hiệu quả phân lớp ảnh đặc biệt là đối với những đặc trưng ảnh tốt và những lớp có số lượng ảnh tương đối và không bị nhiễu. Từ khóa Phân lớp ảnh đặc trưng ảnh đặc trưng văn bản hồi quy logistic. I. GIỚI THIỆU Một trong những nhiệm vụ quan trọng hiện nay trong lĩnh vực thị giác máy tính đó là phân lớp đối tượng. Phân lớp đối tượng là một nhiệm vụ dễ dàng cho con người nhưng lại là một vấn đề khá phức tạp đối với máy học đặc biệt là phân lớp đối tượng trong ảnh. Hiện nay đã có nhiều nghiên cứu về lĩnh vực nhận dạng và phân lớp ảnh như nghiên cứu của Torralba 2 về nhận dạng đối tượng trong ảnh có kích thước nhỏ 32x32 pixels dùng phương pháp trích đặc trưng SIFT nghiên cứu của Đỗ Thanh Nghị 4 về phân lớp ảnh với giải thuật giảm gradient ngẫu nhiên đa lớp dựa vào phương pháp biểu diễn ảnh bằng đặc trưng SIFT và mô hình túi từ. Ngoài ra còn có các nghiên cứu khác về lĩnh vực này 6 7 14 16 sử dụng cách tiếp cận rút trích đặc trưng dựa trên phát hiện của các điểm màu sắc kết cấu

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.