Đánh giá các thuật toán tối ưu đối với mô hình mạng nơ ron tích chập trong tác vụ nhận diện hình ảnh

Bài viết đưa ra cách tiếp cận gần gũi nhất về thuật toán tối ưu cũng như các thuật toán tối ưu thường được sử dụng. Để thực hiện khảo sát, lựa chọn mô hình mạng nơ-ron tích chập (Convolution neural network - CNN), độ hiệu quả của các thuật toán tối ưu sẽ được đánh giá dựa trên giá trị hàm mất mát và tỉ lệ nhận dạng đúng của mô hình mạng đối với hai bộ cơ sở dữ liệu là MNIST và CIFAR-10. | TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ Trường Đại học Khoa học ĐH Huế Tập 18 Số 1 2021 ĐÁNH GIÁ CÁC THUẬT TOÁN TỐI ƯU ĐỐI VỚI MÔ HÌNH MẠNG NƠ-RON TÍCH CHẬP TRONG TÁC VỤ NHẬN DIỆN HÌNH ẢNH Vương Quang Phước Nguyễn Đức Nhật Quang Khoa Điện Điện tử và Công nghệ vật liệu Trường Đại học Khoa học Đại học Huế Email vqphuoc@ Ngày nhận bài 17 6 2020 ngày hoàn thành phản biện 14 5 2021 ngày duyệt đăng 02 6 2021 TÓM TẮT Với vai trò quan trọng trong việc xây dựng và huấn luyện đánh giá mô hình mạng nơ-ron thuật toán tối ưu là một công cụ hữu ích trong việc tìm giá trị hàm mất mát từ đó có sự điều chỉnh mô hình mạng một cách hợp lý góp phần tăng tỉ lệ nhận dạng đúng trong tác vụ nhận diện hình ảnh. Bài báo đưa ra cách tiếp cận gần gũi nhất về thuật toán tối ưu cũng như các thuật toán tối ưu thường được sử dụng. Để thực hiện khảo sát chúng tôi lựa chọn mô hình mạng nơ-ron tích chập Convolution neural network - CNN độ hiệu quả của các thuật toán tối ưu sẽ được đánh giá dựa trên giá trị hàm mất mát và tỉ lệ nhận dạng đúng của mô hình mạng đối với hai bộ cơ sở dữ liệu là MNIST và CIFAR-10. Bên cạnh đó vai trò các tham số và các thuật toán chi phối đến kết quả như tỉ lệ học Learning rate số chu kì học Epoch hàm mất mát hàm Entropy chéo cũng sẽ được làm rõ trong quá trình thực nghiệm. Từ khóa mạng nơ-ron tích chập thuật toán tối ưu SGD RMS AdaGrad AdaDelta Adam. 1. MỞ ĐẦU Để huấn luyện một mô hình mạng nơ-ron chúng ta cần dựa trên giá trị hàm mất mát để biết được sự khác biệt giữa các dự đoán của mô hình đưa ra và nhãn mà chúng ta muốn dự đoán. Giá trị hàm mất mát càng bé có nghĩa là mô hình học đưa ra càng chính xác. Với mục tiêu hạ thấp giá trị của hàm mất mát việc sử dụng các thuật toán tối ưu tập hợp các tham số và siêu tham số parameter và hyper parameter là một thành phần cốt lõi giúp cải thiện kết quả nhận dạng. Trong bài báo này chúng tôi thực hiện khảo sát các thuật toán tối ưu hiện đang nhận được nhiều sự quan tâm như SGD RMS Prop AdaGrad AdaDelta và Adam. Mỗi thuật toán

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU XEM NHIỀU
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.