به طور خلاصه، کلان داده مجموعه بزرگتر و پیچیده تری از داده ها است، به ویژه از یک منبع داده جدید، و با این حال منابع جدید داده به طور تصاعدی با گذشت زمان در حال رشد هستند. این مجموعه داده ها به قدری بزرگ هستند که سیستم پردازش داده سنتی نمی تواند آنها را به طور کارآمد ذخیره، پردازش و مدیریت کند. اما این حجم انبوه داده را می توان برای حل مشکلات تجاری غیرقابل حل قبلی استفاده کرد.

موارد استفاده مختلفی از داده های بزرگ وجود دارد، به عنوان مثال:

  • کشف الگوهای خرید برای مشتریان
  • تبلیغات شخصی و توصیه های محصول مرتبط
  • ترجیحات شخصی برای پیشنهادات محتوا برای یک موتور جستجو
  • ردیابی شرایط سلامت از طریق داده‌های پوشیدنی
  • نقشه برداری زنده از جاده ها برای وسایل نقلیه خودران.
  • ترتیب پیش بینی موجودی ها

برخی از حقایق در مورد داده های بزرگ

  • مردم روزانه 2.5 کوئینتیلیون بایت داده تولید می کنند. نزدیک به 90 درصد از کل داده ها در دو سال گذشته ایجاد شده است. هر روز حدود یک ترابایت داده تجاری جدید توسط بورس نیویورک تولید می شود.
  • ارقام نشان می دهد که هر روز بیش از 500 ترابایت داده جدید در پایگاه داده های پلت فرم شبکه اجتماعی فیس بوک جذب می شود.
  • گوگل به تنهایی به طور متوسط ​​بیش از 40 هزار پرس و جو در ثانیه را پردازش می کند که به بیش از 3.5 میلیارد در یک روز می رسد.
  • دیتاسنترهای امروزی مساحتی برابر با 6000 زمین فوتبال را اشغال می کنند.