Bài giảng Học sâu và ứng dụng: Bài 3 - ĐH Bách khoa Hà Nội

Bài giảng Học sâu và ứng dụng: Bài 3 Giới thiệu về mạng tích chập Conv Neural Networks, cung cấp cho người học những kiến thức như: Lớp gộp max pooling; Một số mạng CNNs cơ bản; Lớp tích chập; ImageNet Large Scale Visual Recognition Challenge (ILSVRC) winners; .Mời các bạn cùng tham khảo! | Chương 3 Giới thiệu về mạng tích chập Conv Neural Networks 2 Lịch sử CNNs Ý tưởng CNNs xuất phát đầu tiên từ công trình của Fukushima năm 1980 3 Lịch sử CNNs Năm 1998 LeCun áp dụng BackProp huấn luyện mạng CNNs cho bài toán nhận dạng văn bản 4 Lịch sử CNNs Năm 2012 CNNs gây tiếng vang lớn khi vô địch cuộc thi ILSRC 2012 vượt xa phương pháp đứng thứ 2 theo cách tiếp cận thị giác máy tính truyền thống. 5 Lịch sử CNNs Hiện nay CNNs ứng dụng khắp nơi ví dụ trong bài toán phân loại ảnh truy vấn ảnh 6 Lịch sử CNNs Ứng dụng CNNs trong bài toán phát hiện đối tượng phân đoạn ảnh 7 Lịch sử CNNs Ứng dụng CNNs trong nhận dạng dáng người human pose trong trò chơi 8 Lớp tích chập Khác với nơ-ron kết nối đầy đủ mỗi nơ-ron tích chập filter chỉ kết nối cục bộ với dữ liệu đầu vào Nơ-ron tích chập trượt từ trái sang phải và từ trên xuống dưới khối dữ liệu đầu vào và tính toán để sinh ra một bản đồ kích hoạt activation map Chiều sâu của nơ-ron tích chập bằng chiều sâu của khối dữ liệu đầu vào 9 Lớp tích chập Bước nhảy stride 1 Đầu vào kích thước 7x7 nơ-ron kích thước 3x3 Đầu ra kích thước 5x5 10 Lớp tích chập Bước nhảy stride 2 Đầu vào kích thước 7x7 nơ-ron kích thước 3x3 Đầu ra kích thước 3x3 11 Lớp tích chập 12 Lớp tích chập Để bảo toàn kích thước thường thêm viền bởi các số 0 zero padding . Ví dụ đầu vào kích thước 7x7 nơ-ron kích thước 3x3 bước nhảy stride 1 padding viền độ rộng 1. Khi đó kích thước đầu ra là 7x7 Lớp tích chập Giả sử có thêm nơ-ron tích chập khác thì nó cũng hoạt động tương tự và sinh ra bản đồ kích hoạt thứ hai Lưu ý trọng số của các nơ-ron tích chập là khác nhau 14 Lớp tích chập Giả sử có 6 nơ-ron tích chập sẽ sinh ra 6 bản đồ kích hoạt Các bản đồ kích hoạt ghép với nhau thành một ảnh mới 15 CNNs Mạng nơ-ron tích chập là một dãy các lớp tích chập nối liên tiếp nhau xen kẽ bởi các hàm kích hoạt ví dụ ReLU 16 Lớp gộp pooling layer Giúp giảm độ phân giải của khối dữ liệu để giảm bộ nhớ và khối lượng tính toán Hoạt động độc lập trên từng bản đồ kích hoạt Lớp gộp .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
173    244    2    25-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.