Mối quan hệ giữa số lượng bản đồ đặc trưng và hiệu suất của mạng CNN

Bài viết trình bày mối quan hệ giữa số lượng bản đồ đặc trưng và hiệu suất của mạng CNN; Đề xuất/cải tiến một mô hình bằng cách xây dựng một lớp mới gọi là “Reduced Dimension” để giảm số lượng bản đồ đặc trưng trên các mạng CNN. | MỐI QUAN HỆ GIỮA SỐ LƯỢNG BẢN ĐỒ ĐẶC TRƯNG VÀ HIỆU SUẤT CỦA MẠNG CNN Phùng Thị Thu Trang1 Tóm tắt Mạng thần kinh tích chập Convolutional neural network - CNN đã đạt được những thành tựu to lớn trong thị giác máy tính. Các mô hình sử dụng CNN được thiết kế để ngày càng sâu hơn sử dụng nhiều bản đồ đặc trưng hơn để trích xuất nhiều tính năng từ hình ảnh đầu vào. Trong công việc này chúng tôi đề xuất cải tiến một mô hình bằng cách xây dựng một lớp mới gọi là Reduced Dimension để giảm số lượng bản đồ đặc trưng trên các mạng CNN. Công việc này giúp cho các mô hình nhẹ hơn và chi phí tính toán ít hơn. Kết quả thử nghiệm trên một số kiến trúc mạng khác nhau cho thấy Lớp giảm kênh hoạt động tốt trên các mô hình sử dụng kĩ thuật sử dụng kết nối tắt đồng nhất như ResNet. Từ khóa Học sâu Mạng thần kính tích chập Lớp giảm kênh Thị giác máy tính. 1. Giới thiệu Học máy đặc biệt là học sâu đã đạt được những thành tựu to lớn trong nhiều lĩnh vực gần đây. Các mô hình được xây dựng dựa trên mạng thần kinh tích chập đã đạt được hiệu suất cao. Ví dụ Alex và các cộng sự. 1 đã xây dựng mạng có tên AlexNet đã giành chiến thắng trong cuộc thi nhận dạng đối tượng ImageNet với độ chính xác 57 top- 1 và top-5 vào năm 2012. Trong các năm tiếp theo nhiều mô hình biến thể dựa trên CNN như ZFNet 2 năm 2013 GoogleNet 3 năm 2014 VGGNet 4 năm 2014 ResNet 5 năm 2015 đã giành chiến thắng trong cuộc thi này. Ngoài phân loại hình ảnh CNN thường được áp dụng cho nhiều bài toán về xử lý ảnh và thi giác máy tính như phát hiện đa đối tượng chú thích hình ảnh phân đoạn hình ảnh. Tuy nhiên những mô hình được liệt kê ở trên được xây dựng với một số tham số lớn và chi phí tính toán phức tạp. Ví dụ vào năm 2012 mạng AlexNet đã sử dụng 60 triệu tham số và 727 triệu phép tính 727 triệu FLOP FLOP được sử dụng theo như bài báo 8 . Năm 2014 VGG Net sử dụng 138 triệu tham số và xấp xỉ 30 tỷ phép tính. Với một số lượng lớn tham số và chi phí tính toán như vậy thì các mô hình sẽ gặp khó khăn lớn khi chạy với thời

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
5    63    2    26-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.