简而言之,大数据是一组更大、更复杂的数据,尤其是来自新数据源的数据,而新数据源却随着时间呈指数级增长。这些数据集非常庞大,以至于传统的数据处理系统无法有效地存储、处理和管理它们。但是这些海量的数据可以用来解决以前无法解决的业务问题。

大数据有许多不同的用例,例如:

  • 为客户发现购买模式。
  • 个性化广告和相关产品推荐
  • 搜索引擎内容建议的个人偏好
  • 通过可穿戴设备的数据跟踪健康状况。
  • 自动驾驶汽车的实时道路测绘。
  • 库存的预测排序。

关于大数据的一些事实

  • 人们每天产生 2.5 万亿字节的数据。近 90% 的数据是在过去两年中创建的。纽约证券交易所每天产生大约 1 TB 的新交易数据。
  • 数据显示,每天有超过 500 TB 的新数据被吸收到 Facebook 社交网络平台的数据库中。
  • 仅谷歌平均每秒处理超过 40,000 个搜索查询,使其在一天内超过 35 亿。
  • 今天的数据中心占据的土地面积相当于近 6,000 个足球场。