Tìm hiểu về Bigdata

Dữ liệu lớn (Bigdata) là tất cả các loại dữ liệu có dung lượng lớn; có giá trị lớn, nhưng khó khai thác và có thể rất nhạy cảm với thời gian. Bigdata đã vượt xa dữ liệu cấu trúc tiêu biểu (typical), nó có thể được truy vấn với hệ thống quản lý dữ liệu quan hệ - thường với những tệp phi cấu trúc (unstructured files), video kỹ thuật số, hình ảnh, dữ liệu cảm biến, tệp lưu nhật ký, thực sự bất cứ dữ liệu nào không có trong hồ sơ với các phạm vi tìm kiếm khác. | Tìm hiểu về Bigdata 07/10/2015 Kỷ yếu Hội thảo khoa học “Thống kê Nhà nước với Dữ liệu lớn” TÌM HIỂU VỀ BIG DATA Nguyễn Gia Luyện Giám đốc Trung tâm Tin học thống kê KVI, TCTK Dữ liệu lớn (Bigdata) là tất cả các loại dữ liệu có dung lượng lớn; có giá trị lớn, nhưng khó khai thác và có thể rất nhạy cảm với thời gian. Bigdata đã vượt xa dữ liệu cấu trúc tiêu biểu (typical), nó có thể được truy vấn với hệ thống quản lý dữ liệu quan hệ - thường với những tệp phi cấu trúc (unstructured files), video kỹ thuật số, hình ảnh, dữ liệu cảm biến, tệp lưu nhật ký, thực sự bất cứ dữ liệu nào không có trong hồ sơ với các phạm vi tìm kiếm khác. Bigdata được hình thành từ nhiều nguồn dữ liệu khác nhau. Quan sát ở hình dưới ta thấy đối với nguồn hình thành nên dữ liệu lớn ở khắp mọi nơi, đặc biệt có sẵn ở mạng xã hội như: Facebook, Twitter Theo tập đoàn SAS có một vài số liệu về Bigdata như sau: + Trong vòng 4 giờ của ngày “Black Friday” năm 2012, cửa hàng Walmart đã phải xử lí hơn 10 triệu giao dịch tiền mặt, tức là khoản giao diện mỗi giây. + Dịch vụ chuyển phát UPS nhận khoảng 39,5 triệu yêu cầ u t ừ khách hàng của mình mỗi ngày + Dịch vu ̣ th ẻ VISA xử lí hơn giao dịch thẻ chỉ trong vòng một ngày mà thôi + Trên Twitter có 500 triệu dòng tweet mới mỗi ngày, Facebook thì có 1,15 tỉ thành viên tạo ra một mớ khổ ng lồ dữ liệu văn bản, tập tin, video 79 07/10/2015 Kỷ yếu Hội thảo khoa học “Thống kê Nhà nước với Dữ liệu lớn” Theo Intel vào tháng 9/2013, hiện nay thế giới đang tạo ra 1 petabyte dữ liệu trong mỗi 11 giây - tương đương với một đoạn video HD dài 13 năm. Ví dụ, eBay thì sử du ̣ng hai trung tâm d ữ liệu dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình . thì phải xử lí hàng triệu hoạt động mỗi ngày, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng t ải lên, YouTube hay

Bấm vào đây để xem trước nội dung
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.