Bài viết giới thiệu một giải pháp đơn giản để cài đặt thuật toán điều khiển tối ưu thích nghi cho bài toán LQ. Giải pháp này giúp giảm được phần lớn số biến vi phân cần cài đặt, kéo theo là giảm được nhiều phép tính phải thực hiện trong thuật toán. | Nghiên cứu khoa học công nghệ MỘT GIẢI PHÁP CÀI ĐẶT ĐƠN GIẢN CHO THUẬT TOÁN ĐIỀU KHIỂN TỐI ƯU THÍCH NGHI Nguyễn Doãn Phước Trịnh Hoàng Minh Nguyễn Hoài Nam Tóm tắt Bài báo giới thiệu một giải pháp đơn giản để cài đặt thuật toán điều khiển tối ưu thích nghi cho bài toán LQ. Giải pháp này giúp giảm được phần lớn số biến vi phân cần cài đặt kéo theo là giảm được nhiều phép tính phải thực hiện trong thuật toán. Giải pháp của bài báo được triển khai cho cả học thích nghi trực tuyến và học thích nghi ngoại tuyến. Các kết quả mô phỏng sau đó đã xác nhận tính áp dụng được của giải pháp này. Từ khóa Điều khiển thông minh Điều khiển học tăng cường Phương pháp biến phân Quy hoạch động. 1. ĐẶT VẤN ĐỀ Trong những năm gần đây khái niệm Điều khiển thông minh được nói đến rất nhiều và gần như trở thành một xu thế thành mốt của thời đại . Dưới tên gọi điều khiển thông minh là một nhóm các phương pháp như điều khiển mờ điều khiển bằng mạng neural điều khiển học lặp điều khiển học tăng cường 1 . Điểm chung của các phương pháp điều khiển thông minh này là ở đó các thông tin động học cần thiết cho việc phân tích và thiết kế bộ điều khiển sẽ không cần phải lấy từ mô hình toán của đối tượng thay vào đó là từ các dữ liệu quá khứ đo được của hệ thống. Chẳng hạn như ở bài toán thiết kế bộ điều khiển tối ưu phản hồi trạng thái cho hệ tuyến tính mô tả bởi mô hình gồm hai ma trận A B x Ax Bu 1 bị ràng buộc bởi hàm mục tiêu dạng toàn phương T T J x Qx u Ru dt min 2 0 có Q QT bán xác định dương R RT xác định dương còn gọi là bộ điều khiển LQR thì việc thiết kế bộ điều khiển này sẽ không còn cần sử dụng đến cả hai ma trận A B của mô hình 1 thay vào đó là từ các dữ liệu vào u và trạng thái x đo được của hệ. Phương pháp thiết kế thông minh đó có tên gọi là xấp xỉ tối ưu hay tối ưu thích nghi 2 3 . Tối ưu thích nghi là công cụ chính của điều khiển học tăng cường. Vai trò là công cụ chính của tối ưu thích nghi còn lấn át các công cụ khác trong điều khiển tăng cường đến mức mà nhiều tài liệu đã .