Tóm lại, dữ liệu lớn là một tập hợp dữ liệu lớn hơn, phức tạp hơn, đặc biệt là từ một nguồn dữ liệu mới, tuy nhiên các nguồn dữ liệu mới đang phát triển theo cấp số nhân theo thời gian. Các tập dữ liệu này quá lớn nên hệ thống xử lý dữ liệu truyền thống không thể lưu trữ, xử lý và quản lý chúng một cách hiệu quả. Nhưng lượng dữ liệu khổng lồ này có thể được sử dụng để giải quyết các vấn đề kinh doanh nan giải trước đây.

Có nhiều trường hợp sử dụng dữ liệu lớn khác nhau, ví dụ:

  • Khám phá các mô hình mua cho khách hàng.
  • Quảng cáo được cá nhân hóa và các đề xuất sản phẩm có liên quan
  • Tùy chọn cá nhân cho các đề xuất nội dung cho một công cụ tìm kiếm
  • Theo dõi tình trạng sức khỏe thông qua dữ liệu từ thiết bị đeo được.
  • Lập bản đồ trực tiếp các con đường dành cho xe tự hành.
  • Dự đoán thứ tự của hàng tồn kho.

Một số thông tin về Dữ liệu lớn

  • Mọi người đang tạo ra 2,5 nghìn tỷ byte dữ liệu mỗi ngày. Gần 90% tất cả dữ liệu đã được tạo trong hai năm qua. Khoảng một terabyte dữ liệu giao dịch mới được tạo ra mỗi ngày bởi Sở giao dịch chứng khoán New York.
  • Các số liệu tiết lộ rằng mỗi ngày, hơn 500 terabyte dữ liệu mới được đưa vào cơ sở dữ liệu của nền tảng mạng xã hội Facebook.
  • Riêng Google xử lý trung bình hơn 40 nghìn truy vấn tìm kiếm mỗi giây, đạt hơn 3,5 tỷ trong một ngày.
  • Các trung tâm dữ liệu ngày nay chiếm một diện tích đất tương đương với gần 6.000 sân bóng đá.