什么是大数据?要从这三个层面来理解

发布于:2022-11-09 ⋅ 阅读:(21) ⋅ 点赞:(0) ⋅ 评论:(0)

本篇内容较长,心急的小伙伴可以先看目录,直接定位到感兴趣的部分:

  • 为啥都在说“大数据”,却很难解释清楚到底啥是“大数据”?
  • 理论层面上的大数据
  • 价值层面上的大数据
  • 技术层面上的大数据


01 为啥都在说“大数据”,却很难解释清楚到底啥是“大数据”?

“大数据”三个字已经被喊烂了,“大数据分析”也经常被人提起。但如果真正问起来“大数据是什么?”却往往不知道如何解释。

这其实很正常,究其原因,

  • 一是因为大家对大数据这类新技术有着相同的原始渴求,至少知其然在聊天时不会显得很“土鳖”;
  • 二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然。

这就导致了虽然大家都在说“大数据”,可真正理解“大数据”是啥的却少之又少!

这篇我想尽量尝试用简洁易懂的话语和案例,来为大家解释“到底什么是大数据?”


02 理论层面上的大数据

最早提出大数据时代到来的是麦肯锡——

“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

业界(IBM 最早定义)将大数据的特征归纳为4个“V”——

量Volume:数据体量大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)
多样Variety:数据类型繁多。比如网络日志、视频、图片、地理位置信息等等。
价值Value:价值密度低,商业价值高。
速Velocity:处理速度快。和传统的数据挖掘技术有着本质的不同。

阿里巴巴的王坚对于大数据也有一些独特的见解,比如——

今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。
非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。
你千万不要想着拿数据去改进一个业务,这不是大数据。你一定是去做了一件以前做不了的事情。

最后一点我非常认同的,大数据的真正价值在于创造,在于填补无数个还未实现过的空白。


03 价值层面上的大数据

大数据的真正价值不在于拥有多少数据,而在于如何使用它,我举一个非常有趣的例子:

1948年辽沈战役期间,司令员林彪要求每天要进行例常的“每日军情汇报”,由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。

那几乎是重复着千篇一律枯燥无味的数据:

  • 每支部队歼敌多少、俘虏多少
  • 缴获的火炮、车辆多少,枪支、物资多少
  • ……

有一天,参谋照例汇报当日的战况,林彪突然打断他:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”

大家都很茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?

林彪扫视一周,见无人回答,便接连问了三句:

“为什么那里缴获的短枪与长枪的比例比其它战斗略高?”
“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高?”
“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高?”

林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:

“我猜想,不,我断定!敌人的指挥所就在这里!”

果然,部队很快就抓住了敌方的指挥官廖耀湘,并取得这场重要战役的胜利。

这些例子真实的反映在各行各业,探求数据价值取决于把握数据的人,关键是人的数据思维;与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长,比如:

  • 近乎实时地确定故障、问题和痛点的根本原因。
  • 比人眼更快、更准确地发现异常。
  • 通过快速将图表数据转化为洞察力来制定解决方案。
  • 在几分钟内重新计算整个风险组合。
  • 提高深度学习模型准确分类和应对不断变化的变量的能力。
  • 提前预判风险、提前准备风险方案。
  • ......

04 技术层面上的大数据

大数据常和云计算联系到一起,云计算思想的起源是麦卡锡在上世纪60年代提出的:

把计算能力作为一种像水和电一样的公用事业提供给用户。

(1)业内是这么形容两者的关系:

  • 没有大数据的信息积淀,则云计算的计算能力再强大,也难以找到用武之地;
  • 没有云计算的处理能力,则大数据的信息积淀再丰富,也终究只是镜花水月。

(2)云计算和大数据之间的联系:

  • 可以提供更多基于海量业务数据的创新型服务;
  • 通过云计算技术的不断发展降低大数据业务的创新成本。

(3)云计算和大数据之间的区别

  • 概念不同:计算改变了IT,大数据改变了业务。然而大数据必须有云作为基础架构,才能得以顺畅运营。
  • 目标受众不同:云计算是CIO等关心的技术层,是一个进阶的IT解决方案。而大数据是CEO关注的、是业务层的产品,大数据的决策者是业务层。

(4)SaaS、PaaS、IaaS之间的区别

最后给大家补充阅读下,SaaS、PaaS、IaaS之间的区别是什么。

通俗解释: IaaS,PaaS和SaaS的区别

以上。