Tổng quan về dữ liệu lớn

Dữ liệu này có từ các nguồn như: hồ sơ hành chính, giao dịch điện tử, dòng trạng thái (status), chia sẻ hình ảnh, bình luận, nhắn tin. của chính chúng ta, nói cách khác chúng là dữ liệu được sản sinh qua quá trình chia sẻ thông tin trực tuyến liên tục của người sử dụng. Nhận thấy vai trò và lợi ích mà dữ liệu lớn đem lại, cộng đồng thống kê quốc tế đã và đang có rất nhiều dự án nghiên cứu, ứng dụng dữ liệu lớn. Để cung cấp cái nhìn tổng quan về dữ liệu lớn cho quý độc giả, bài viết này giới thiệu tóm tắt những nét chính cũng như những cơ hội và thách thức mà dữ liệu lớn mang lại. | Tổng quan về dữ liệu lớn Tổng quan về dữ liệu lớn Nghiên cứu – Trao đổi TỔNG QUAN VỀ DỮ LIỆU LỚN Văn Đoàn1 Công Hoan2 Trước đây, chúng ta mới chỉ biết đến dữ liệu có cấu trúc (structure data), ngày nay, với sự kết hợp của dữ liệu và internet, đã xuất hiện một dạng khác của dữ liệu - Big data (dịch là “dữ liệu lớn”). Dữ liệu này có từ các nguồn như: hồ sơ hành chính, giao dịch điện tử, dòng trạng thái (status), chia sẻ hình ảnh, bình luận, nhắn tin. của chính chúng ta, nói cách khác chúng là dữ liệu được sản sinh qua quá trình chia sẻ thông tin trực tuyến liên tục của người sử dụng. Nhận thấy vai trò và lợi ích mà dữ liệu lớn đem lại, cộng đồng thống kê quốc tế đã và đang có rất nhiều dự án nghiên cứu, ứng dụng dữ liệu lớn. Để cung cấp cái nhìn tổng quan về dữ liệu lớn cho quý độc giả, bài viết này giới thiệu tóm tắt những nét chính cũng như những cơ hội và thách thức mà dữ liệu lớn mang lại. Khái niệm, đặc trƣng của dữ liệu lớn và sự khác biệt với dữ liệu truyền thống - Dữ liệu lớn (Big data) là một thuật ngữ chỉ bộ dữ liệu lớn hoặc phức tạp mà các phương pháp truyền thống không đủ các ứng dụng để xử lý dữ liệu này [1]. Dữ liệu lớn được hình thành chủ yếu từ các nguồn: (1) Dữ liệu hành chính (phát sinh từ chương trình của một tổ chức, có thể là dụ theo dõi dữ liệu từ điện thoại di động, GPS; chính phủ hay phi chính phủ). Ví dụ, hồ sơ y tế (5) Dữ liệu từ các hành vi, ví dụ như tìm kiếm điện tử ở bệnh viện, hồ sơ bảo hiểm, hồ sơ trực tuyến về một sản phẩm, một dịch vụ hay ngân hàng.; (2) Dữ liệu từ hoạt động thương bất kỳ loại thông tin khác, trang xem trực mại (phát sinh từ các giao dịch giữa hai thực tuyến; (6) Dữ liệu từ các thông tin ý kiến trên thể). Ví dụ, các giao dịch thẻ tín dụng, giao các phương tiện thông tin xã hội. dịch trên mạng, bao gồm cả từ các thiết bị di Dữ liệu lớn có 5 đặc trưng cơ bản như động; (3) Dữ liệu từ các thiết bị cảm biến như sau (mô hình 5Vs về dữ liệu .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.