Báo cáo tài liệu vi phạm
Giới thiệu
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
THỊ TRƯỜNG NGÀNH HÀNG
NÔNG NGHIỆP, THỰC PHẨM
Gạo
Rau hoa quả
Nông sản khác
Sữa và sản phẩm
Thịt và sản phẩm
Dầu thực vật
Thủy sản
Thức ăn chăn nuôi, vật tư nông nghiệp
CÔNG NGHIỆP
Dệt may
Dược phẩm, Thiết bị y tế
Máy móc, thiết bị, phụ tùng
Nhựa - Hóa chất
Phân bón
Sản phẩm gỗ, Hàng thủ công mỹ nghệ
Sắt, thép
Ô tô và linh kiện
Xăng dầu
DỊCH VỤ
Logistics
Tài chính-Ngân hàng
NGHIÊN CỨU THỊ TRƯỜNG
Hoa Kỳ
Nhật Bản
Trung Quốc
Hàn Quốc
Châu Âu
ASEAN
BẢN TIN
Bản tin Thị trường hàng ngày
Bản tin Thị trường và dự báo tháng
Bản tin Thị trường giá cả vật tư
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
NGÀNH HÀNG
NÔNG NGHIỆP, THỰC PHẨM
Gạo
Rau hoa quả
Nông sản khác
Sữa và sản phẩm
Thịt và sản phẩm
Dầu thực vật
Thủy sản
Thức ăn chăn nuôi, vật tư nông nghiệp
CÔNG NGHIỆP
Dệt may
Dược phẩm, Thiết bị y tế
Máy móc, thiết bị, phụ tùng
Nhựa - Hóa chất
Phân bón
Sản phẩm gỗ, Hàng thủ công mỹ nghệ
Sắt, thép
Ô tô và linh kiện
Xăng dầu
DỊCH VỤ
Logistics
Tài chính-Ngân hàng
NGHIÊN CỨU THỊ TRƯỜNG
Hoa Kỳ
Nhật Bản
Trung Quốc
Hàn Quốc
Châu Âu
ASEAN
BẢN TIN
Bản tin Thị trường hàng ngày
Bản tin Thị trường và dự báo tháng
Bản tin Thị trường giá cả vật tư
Thông tin
Tài liệu Xanh là gì
Điều khoản sử dụng
Chính sách bảo mật
0
Trang chủ
Khoa Học Tự Nhiên
Toán học
Điều khiển tối ưu thích nghi trên cơ sở học tăng cường tích phân trực tuyến
Đang chuẩn bị liên kết để tải về tài liệu:
Điều khiển tối ưu thích nghi trên cơ sở học tăng cường tích phân trực tuyến
Gia Huy
202
11
pdf
Không đóng trình duyệt đến khi xuất hiện nút TẢI XUỐNG
Tải xuống
Bài viết này đề xuất một cách tiếp cận trực tuyến để điều khiển tối ưu thích nghi trực tiếp với chi phí vô hạn cho các hệ thống phi tuyến trong một khung thời gian liên tục. Sự hội tụ của thuật toán trực tuyến với các giải pháp điều khiển tối ưu mà không yêu cầu động học nội của hệ thống. Tính ổn định động vòng kín được đảm bảo. | ĐIỀU KHIỂN TỐI ƯU THÍCH NGHI TRÊN CƠ SỞ HỌC TĂNG CƯỜNG TÍCH PHÂN TRỰC TUYẾN Nguyễn Thị Thắm Vũ Văn Tú Khoa Điện-Cơ Email thamnt@dhhp.edu.vn tuvv@dhhp.edu.vn Ngày nhận bài 24 8 2020 Ngày PB đánh giá 22 9 2020 Ngày duyệt đăng 25 9 2020 TÓM TẮT Bài báo này đề xuất một cách tiếp cận trực tuyến để điều khiển tối ưu thích nghi trực tiếp với chi phí vô hạn cho các hệ thống phi tuyến trong một khung thời gian liên tục. Sự hội tụ của thuật toán trực tuyến với các giải pháp điều khiển tối ưu mà không yêu cầu động học nội của hệ thống. Tính ổn định động vòng kín được đảm bảo. Thuật toán được xây dựng trên chương trình học tăng cường RL cụ thể là thuật toán lặp PI Policy Iteration và sử dụng mạng nơ-ron trong cấu trúc Actor Critic để biểu diễn thông số của luật điều khiển và hiệu suất của hệ thống điều khiển. Hai mạng nơ-ron được huấn luyện để thể hiện bộ điều khiển tối ưu và hàm chi phí tối ưu mô tả hiệu suất của bộ điều khiển vô hạn. Kết quả là một cấu trúc điều khiển lai trong đó gồm một bộ điều khiển liên tục theo thời gian và một cấu trúc điều khiển thích nghi giám sát hoạt động dựa trên dữ liệu được lấy mẫu từ đối tượng và hiệu suất động học thời gian liên tục. Các phân tích lý thuyết và kết quả mô phỏng chứng minh sự hiệu quả của thuật toán đề xuất. Từ khóa Điều khiển tối ưu thích nghi trực tiếp Thuật toán lặp Mạng nơ-ron Điều khiển trực tuyến. ADAPTIVE OPTIMAL CONTROL BASED ON OFF-LINE INTEGRAL REINFORCEMENT LEARNING ABTRACT This paper proposes in a continuous-time framework an online approach to direct adaptive optimal control with infinite horizon cost for nonlinear systems. The algorithm converges online to the optimal control solution without knowledge of the internal system dynamics. Closed-loop dynamic stability is guaranteed throughout. The algorithm is based on a reinforcement learning scheme namely Policy Iterations and makes use of neural networks in an Actor Critic structure to parametrically represent the control policy and the performance of the control .
TÀI LIỆU LIÊN QUAN
Cấu trúc và thuật toán điều khiển thích nghi quá trình gia công
Ebook Lý thuyết điều khiển tự động thông thường và hiện đại (Quyển 4: Hệ tối ưu - Hệ thích nghi): Phần 1
Ebook Lý thuyết điều khiển tự động thông thường và hiện đại (Quyển 4: Hệ tối ưu - Hệ thích nghi): Phần 2
Điều khiển tối ưu thích nghi trên cơ sở học tăng cường tích phân trực tuyến
Điều khiển dự báo Tube-MPC thích nghi cho hệ phi tuyến có khâu phi tuyến không biết trước thỏa mãn điều kiện liên tục lipschitz
Ebook Lý thuyết điều khiển tự động hiện đại: Phần 1 - PGS.TS. Nguyễn Thương Ngô
Ebook Lý thuyết điều khiển tự động hiện đại: Phần 2 - PGS.TS. Nguyễn Thương Ngô
Bài giảng; Lý thuyết điều khiển hiện đại
Điều khiển tối ưu trực tuyến cho các hệ phi tuyến liên tục
Điều khiển bám tàu mặt nước bất định mô hình và nhiễu ngoài thông qua bộ điều khiển học tăng cường thích nghi trực tuyến và RISE
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.