Dữ liệu lớn (Big data) là chủ đề đang thu hút được sự quan tâm tại nhiều quốc gia trên thế giới với những lĩnh vực ứng dụng cụ thể như: chính trị, kinh tế, giao thông vận tải, y học, thống kê Để hiểu rõ hơn về những ứng dụng Big data vào công tác thống kê của các cơ quan và tổ chức thống kê thế giới, bài viết sau giới thiệu về hai dự án thực tế khai thác loại dữ liệu này trong lĩnh vực thống kê giá mà Cơ quan thống kê quốc gia Anh (ONS) và Viện Thống kê và nghiên cứu Kinh tế quốc gia Pháp (INSEE) đã thực hiện thành công. | Ứng dụng Big data trong thống kê đánh giá 07/10/2015 Kỷ yếu Hội thảo khoa học “Thống kê Nhà nước với Dữ liệu lớn” ỨNG DỤNG BIG DATA TRONG THỐNG KÊ GIÁ Thị Minh Ánh Phòng Nghiên cứu khoa học và Chiến lược PTTK, Viện KHTK Dữ liệu lớn (Big data) là chủ đề đang thu hút được sự quan tâm tại nhiều quốc gia trên thế giới với những lĩnh vực ứng dụng cụ thể như: chính trị, kinh tế, giao thông vận tải, y học, thống kê Để hiểu rõ hơn về những ứng dụng Big data vào công tác thống kê của các cơ quan và tổ chức thống kê thế giới, bài viết sau giới thiệu về hai dự án thực tế khai thác loại dữ liệu này trong lĩnh vực thống kê giá mà Cơ quan thống kê quốc gia Anh (ONS) và Viện Thống kê và nghiên cứu Kinh tế quốc gia Pháp (INSEE) đã thực hiện thành công. 1. Sử dụng công nghệ Web Scraper để khai thác nguồn dữ liệu Big data phục vụ tính chỉ số CPI Sự tăng trưởng của bán hàng trực tuyến những năm gần đây đồng nghĩa với việc các dịch vụ hàng hóa và các thông tin giá cả liên quan có thể được tìm thấy thông qua mạng. Thông tin chỉ số giá tiêu dùng CPI và chỉ số giá bán lẻ RPI là các chỉ tiêu kinh tế quan trọng mà ONS đặc biệt quan tâm. Với sự hỗ trợ của công nghệ Web Scraper (công cụ phần mềm giúp trích xuất dữ liệu từ các trang web) cùng với kỹ thuật trích xuất nội dung từ trang web (Web scraping) có thể mang lại cơ hội cho ONS thu thập các dữ liệu về một số mặt hàng và dịch vụ một cách tự động thay vì việc các điều tra viên phải đi điều tra từng cửa hàng để thu thập số liệu. Điều này mang lại một loạt các lợi ích tiềm năng như giảm bớt chi phí thu thập thông tin, mở rộng phạm vi (ví dụ: nhiều danh mục hàng hóa sản phẩm hơn) và tăng tính đều đặn. Cơ quan thống kê quốc gia Anh (ONS) đã tiến hành 4 dự án về Big data cho thống kê Nhà nước, trong đó có dự án “Sử dụng công nghệ Web Scraper để khai thác nguồn dữ liệu Big data phục vụ tính chỉ số CPI”. Dự án kéo dài trong vòng 15 tháng và đã kết thúc vào tháng .