全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+
当前位置:首页  >  大数据培训问答  > 详情

为什么大数据不能被直接拿来使用?

匿名提问者2018-08-07

为什么大数据不能被直接拿来使用?

推荐答案

  随着互联网的发展,大家对大数据的概念也并不陌生,但也不排除有一部分人认为在大数据时代,“样本=全体”,人们得到的不是抽样数据而是全数据,因而只需要简单地数一数就可以下结论。如此简单粗暴的下结论,是不正确的,为什么这么说?今天千锋小编就带你了解一下为什么说大数据不能被直接拿来使用?

  首先,大数据告知信息但不解释信息。打个比方说,大数据是“原油”而不是“汽油”,不能被直接拿来使用。就像股票市场,即使把所有的数据都公布出来,不懂的人依然不知道数据代表的信息。其实在大数据时代,统计学依然是数据分析的灵魂。

  其次,全数据的概念本身很难经得起推敲。全数据,顾名思义就是全部数据。这在某些特定的场合对于某些特定的问题确实可能实现。比如,要比较清华、北大两校同学数学能力整体上哪个更强,可以收集到两校同学高考时的数学成绩作为研究的数据对象。从某种意义上说,这是全数据。但是并不是说我们有了这个全数据就能得到完全准确的答案。

图片1

  因为一方面,这个数据虽然是全数据,但仍然具有不确定性。另一方面,事物在不断地发展和变化,同学入校时的成绩并不能够代表现在的能力。全体同学的高考成绩数据,仅对于那次考试而言是全数据。“全”是有边界的,超出了边界就不再是全知全能了。事物的发展充满了不确定性,而统计学,既研究如何从数据中把信息和规律提取出来,找出最优化的方案;也研究如何把数据当中的不确定性量化出来。

  因此我们说在大数据时代,数据分析的很多根本性问题和小数据时代并没有本质区别。当然,大数据的特点,确实对数据分析提出了全新挑战。如果你对大数据感兴趣,那么不妨来千锋大数据培训看一看!

在线咨询 免费试学 教程领取