Bài viết Xây dựng hệ thống đánh thức thiết bị bằng từ khóa tiếng Việt xây dựng hệ thống KWS để kích hoạt thiết bị khi phát hiện từ khóa tiếng Việt dựa trên kiến trúc mạng nơ-ron tích chập tiên tiến - CNN. | Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN 978-604-82-2981-8 XÂY DỰNG HỆ THỐNG ĐÁNH THỨC THIẾT BỊ BẰNG TỪ KHÓA TIẾNG VIỆT Dương Văn Phụng1 2 Đỗ Văn Hải1 1 Trường Đại học Thủy lợi 2 Trung tâm Không gian Mạng Viettel email haidv@ 1. GIỚI THIỆU CHUNG hiện từ khóa tiếng Việt dựa trên kiến trúc mạng nơ-ron tích chập tiên tiến - CNN 3 . Với sự phát triển nhanh chóng của các thiết bị di động và các thiết bị Internet of 2. PHƯƠNG PHÁP NGHIÊN CỨU Things IoT hệ thống đánh thức thiết bị ngày càng trở nên cần thiết. Hệ thống này Theo Hình 1 một hệ thống KWS được giúp người dùng kích hoạt thiết bị thông chia làm 3 thành phần chính 3 qua tiếng nói mà không cần sử dụng đến - Trích chọn đặc trưng Feature extraction . các nút bấm vật lý hay màn hình cảm ứng. - Mạng nơ-ron Neural network . Cách thức này được gọi là đánh thức thiết - Đánh giá xác suất hậu nghiệm Posterior bị bằng cách phát hiện từ khóa KWS - handling . Keyword spotting . Một ví dụ điển hình của hệ thống đánh thức thiết bị là Google đã triển khai hệ thống cho phép người dùng sử dụng chế độ kích hoạt nhận dạng giọng nói hoàn toàn rảnh tay được biết đến với từ khóa quot Ok Google quot hoặc quot Hey Google quot 2 . Hệ thống luôn luôn lắng Hình 1. Ba thành phần chính của hệ thống nghe để phát hiện từ khóa từ đó kích hoạt keyword spotting 3 thiết bị trước khi khởi động hệ thống nhận Để xây dựng hệ thống KWS cho tiếng dạng tiếng nói. Hệ thống này đã và đang Việt chúng tôi sử dụng kiến trúc mạng nơ- được Google nghiên cứu và triển khai rất ron tích chập CNN 3 . Như mô tả trên thành công đối với ngôn ngữ là tiếng Anh. Hình 2 chúng tôi sử dụng mạng CNN với Tuy nhiên hiện chưa có nghiên cứu nào cho 2 lớp tích chập 1 lớp kết nối đầy đủ và 1 lớp hệ thống KWS với ngôn ngữ là tiếng Việt. softmax. Có nhiều phương pháp để xây dựng KWS như sử dụng mạng nơ-ron sâu Deep Neural Network - DNN 1 mạng nhớ ngắn-dài Long Short Term Memory - LSTM 4 . Tuy nhiên thời gian gần đây cách tiếp cận sử dụng mạng nơ-ron tích chập