Đối với việc chuyển đổi âm thanh giọng nói thành tín hiệu điều khiển, có thể sử dụng nền tảng có sẵn hoặc mô hình được huấn luyện để nhận dạng giọng nói. Nghiên cứu này sử dụng phương pháp xây dựng mô hình mạng CNN (Convolution Neural Network) để tiến hành nhận dạng các từ khóa cơ bản có trong tiếng nói thu được. | Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN 978-604-82-7001-8 ĐIỀU KHIỂN ROBOT DI ĐỘNG SÁU CHÂN THÔNG QUA ÂM THANH Nguyễn Tuấn Anh1 Nguyễn Tiến Thịnh1 Nguyễn Huy Thế1 1 Trường Đại học Thủy lợi email nguyehuythe@ 1. GIỚI THIỆU CHUNG . Thu thập dữ liệu âm thanh Việc chế tạo và vận hành robot di động sáu Dữ liệu âm thanh được lựa chọn cho quá chân có ý nghĩa khoa học góp phần phát triển trình huấn luyện mô hình là Google Speech lĩnh vực nghiên cứu robot có cấu trúc chuỗi Command datasets 1 . Tệp dữ liệu này bao động học song song đồng thời phục vụ đào tạo gồm hơn file audio ở định dạng .wav các môn học chuyên ngành thuộc lĩnh vực kỹ của hơn 30 từ tiếng Anh khác nhau. Với mục thuật cơ điện tử kỹ thuật robot. Tuy nhiên các tiêu là điều khiển robot các từ khóa gần gũi nghiên cứu về robot sáu chân hầu hết tập trung với phương hướng chuyển động của robot vào bài toán thiết kế và điều khiển cơ bản được sử dụng bao gồm yes up down chưa có sự tương tác với môi trường xung left right stop go off . quanh. Do đó bài toán điều khiển robot sáu . Xử lý dữ liệu chân thông qua tương tác trực tiếp với người dùng rất cần thiết đặc biệt là ứng dụng công Các tệp dữ liệu âm thanh nêu trên bao gồm nghệ nhận dạng và xử lý âm thanh. chuỗi số liệu về biên độ của tín hiệu âm Đối với việc chuyển đổi âm thanh giọng nói thanh tại thời điểm trích mẫu tương ứng. thành tín hiệu điều khiển có thể sử dụng nền Hình 1 biểu diễn dữ liệu theo thời gian của tảng có sẵn hoặc mô hình được huấn luyện để file âm thanh của từ left . nhận dạng giọng nói. Nghiên cứu này sử dụng phương pháp xây dựng mô hình mạng CNN Convolution Neural Network để tiến hành nhận dạng các từ khóa cơ bản có trong tiếng nói thu được. Mô hình nhận dạng được xây dựng bởi thư viện mã nguồn mở Tensorflow trong Hình 1. Dữ liệu file âm thanh ngôn ngữ Python sau đó sẽ được huấn luyện với các tệp dữ liệu âm thanh có đánh nhãn và Chuỗi tín hiệu tuy dài nhưng hàm lượng được kiểm nghiệm bằng cách triển khai