Короче говоря, большие данные — это более крупный и сложный набор данных, особенно из нового источника данных, и тем не менее количество новых источников данных со временем растет экспоненциально. Эти наборы данных настолько велики, что традиционная система обработки данных не может эффективно хранить, обрабатывать и управлять ими. Но этот огромный объем данных можно использовать для решения ранее неразрешимых бизнес-задач.

Существует множество различных вариантов использования больших данных, например:

  • Выявление покупательских моделей для клиентов.
  • Персонализированная реклама и релевантные товарные рекомендации
  • Персональные настройки предложений контента для поисковой системы
  • Отслеживание состояния здоровья с помощью данных с носимых устройств.
  • Живое картографирование дорог для автономных транспортных средств.
  • Упреждающий заказ запасов.

Некоторые факты о больших данных

  • Каждый день люди генерируют 2,5 квинтиллиона байтов данных. Почти 90% всех данных было создано за последние два года. Каждый день Нью-Йоркская фондовая биржа генерирует около одного терабайта новых торговых данных.
  • Цифры показывают, что каждый день более 500 терабайт новых данных поглощаются базами данных платформы социальной сети Facebook.
  • Только Google обрабатывает в среднем более 40 тысяч поисковых запросов в секунду, что составляет более 3,5 миллиардов за один день.
  • Сегодняшние центры обработки данных занимают территорию, равную по площади почти 6000 футбольным полям.