大数据,通俗的来讲就是很多很多的数据,这些数据包含有各种类型,人工无法判断或者判断不出(虽然这些数据具有一定的相关性)。大数据的应用主要是根据其相关性,通过一定的算法来“提纯”有效的数据。
1、大数据包含的内容
可以这样说,你在网上的一切行为产生的数据,都会成为大数据的一部分。在大数据时代,每个上网的人都是在裸奔。你的一切行为产生的数据都会被收集起来,依托这些数据,经过一系列算法,就可以掌握你的方方面面。大数据也许比你更加了解自己。
比如你正在看的这篇文章,这个文章什么时候推送给你,你什么时候点开,点开后看了多少内容,这些数据都会被收集起来,成为百度大数据的一部分,通过一定的算法可以分析出来你是否喜欢这篇文章,你可能会喜欢什么样的文章,然后根据这些数据给你推荐你感兴趣的文章。
又比如你在某宝购物,你什么时候开始浏览某一件宝贝,你是否经过n分钟和客服讨价还价,你最后在几点几分下单成交,这些收集起来的数据,就组成了某宝的大数据。某宝可以通过算法,给你推荐你感兴趣的宝贝或者做一些数据统计。
2、大数据的应用特点
大家小时候都唱过或听过这样一首儿歌,儿歌里说:“因为所以,科学道理”。这个其实是在说,我们习惯性的思维方式是“因为什么。所以什么”,是一种因果性的思维方式。而大数据的思维方式与这种思维方式不同,大数据关注相关性,不关注因果性。大数据应用的核心就是相关性。
例如阿里巴巴通过数据魔方(它们的大数据产品),从海量的购物大数据中,提炼出消费跟女性胸部成正比的结论。女生胸部和消费能力(购物量)存在什么因果关系,这个无从得知,但是不妨碍利用相关性得到这个结论和使用这个结论。
通俗的来讲,利用大数据可以知道,很多人同时做了A和B两件事情(或者是拥有A特点的人,会做B事情),那么就可以得出A和B具有相关性。给做了A或者B事情(拥有A特性)的人,推荐另外一种。当然真正的大数据,不会只分析两个特性,需要进行多维度分析,才能提炼出有效的结论。