Nội dung luận văn này được trình bày trong 4 chương: chương 1 trình bày các khái niệm cơ bản phục vụ cho đề tài; chương 2 trình bày các kiến thức cơ bản về Hadoop và MapReduce, giới thiệu về kiến trúc của Hadoop, MapReduce cũng nhƣ cơ chế làm việc của chúng; Chƣơng 3 sẽ trình bày về việc ứng dụng Hadoop và MapReduce vào mô hình ngôn ngữ; chương 4 giới thiệu về công cụ thực nghiệm và kết quả thực nghiệm. | ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ VŨ THỊ THANH MÔ HÌNH NGÔN NGỮ SỬ DỤNG MAPREDUCE Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã Số: 60480103 LUẬN VĂN THẠC SĨ NGƢỜI HƢỚNG DẪN KHOA HỌC CHÍNH: TS. NGUYỄN VĂN VINH NGƢỜI HƢỚNG DẪN KHOA HỌC PHỤ: TS. NGUYỄN PHÚ BÌNH Hà Nội – 2016 i MỤC LỤC MỤC LỤC i LỜI CẢM ƠN . iii LỜI CAM ĐOAN iv DANH MỤC THUẬT NGỮ VIẾT TẮT v DANH MỤC HÌNH VẼ. vi DANH MỤC BẢNG .vii GIỚI THIỆU . 8 Chương 1:Mô hình ngôn ngữ 10 Giới thiệu: . 10 Mô hình ngôn ngữ N-gram . 11 Khó khăn khi xây dựng mô hình ngôn ngữ N-gram 13 Phân bố không đều: 13 Kích thước bộ nhớ của mô hình ngôn ngữ 13 Các phương pháp làm .