数据是有价值的,但大数据最核心的价值到底是什么?能够用大数据来作什么呢?
我总结了一下,大数据最核心的作用和价值有四个方面:
1) 查看数据规律,来探索事物的运行规律和特征
2) 发现数据变化,来探索业务的变化和业务问题
3) 理清数据关系,来寻找影响业务运行的关键因素
4) 拟合数据模型,来预判业务在未来的发展趋势
下面我将为大家举一些案例,看如何利用大数据来实现这些价值。
3.1 探索规律
利用大数据来探索业务运行的规律和特征。
拿产品的销量分析来说,我们收集产品的销量数据,作趋势分析,得到下图所示的按照时间维度(星期)的折线图。
从数据的特征可以看出,产品的销量基本上是随着时间在逐步上升的,周末的产品销量比较高,即非工作日比工作日的产品销量要高,这是绝大多数零售店的销售规律,即“周末是交易高峰时间”。
而销量高,也就意味着在产品销售上的规律,即客流量比较大,看来周末上街购物的人数比较多。所以,从业务角度看,也就发现了客流量在时间上的分布规律。
基于客流量的分布规律,就可以提出如下的业务建议或策略:在人力安排上,周末需要更多的销售员工上班;在库存管理上,在周四或周五就要安排人员检查库存,确保库存中有足够的产品在周末售卖;在营销活动的时间安排上,要想达到更好的品牌宣传效果或者销售业绩,就得选择在客流量多的周末时间进行宣传和促销,等等。
所以,大数据能够帮助我们做决策,是怎样做到的呢?
背后的思维其实很简单,就是,先利用数据来探索业务的发展规律和特征,再利用业务规律,按规律来决策,就能够做到事半功倍的效果。
哲学告诉我们,任何事物都是发展的,发展必定是有规律的,即万物皆有规律。
任何客观事物,大到天体运行,中到社会发展,小到原子分子的运行,都是有规律的。而大数据,则是探索事物规律的有效的工具!
3.2 发现变化
利用大数据来发现业务运行的变化和问题。
谷歌公司的流感趋势预测产品(Google Flu Trends, GFT)是2008年推出的一款预测流感的产品,可以说是比较早的一个大数据产品了。
正常情况下,传统的疫情报告是由各地医院、诊所和医务人员向美国CDC(疾病控制和预防中心)上报的,但这种方法往往会有10~14天的时间延迟,而在这两周内,疫情有可能早已经迅速扩散。而谷歌的这款产品,却可以利用了各个地区用户搜索关键词的数据量来判断流感的传播情况,来实时呈现或预测流感蔓延到哪个地区了,这对于CDC及时控制疫情具有更大的指导意义。
谷歌工程师每天都会对搜索感冒相关词的搜索量做分析,在正常情况下,某地区每日的搜索量都会在一个正常的范围内波动。但如果有一天(比如12号开始),某地区的搜索量开始持续上升,这上升的背后,其实体现的是患感冒人数的增加。这就是GFT产品背后的数据思维,基于搜索词的热度来预测流感的爆发。这个产品,甚至可以在流感爆发前的7-14天就能够做出预判。因此,国家或企业都可以基于此预测进行相应的准备活动。
所以,可以基于数据的变化,而探知业务的变化,从而可以进一步思考给出相应的业务判断和业务建议。即,数据的变化就意味着业务的变化。
这也是我们做决策的另一个底层逻辑,找到业务短板和变化,给出应对策略。最典型的就是运营分析,通过大量的KPI指标来呈现业务运营的各个环节的发展情况,以找到需要改进的环节,并做出优化建议。
世界是物质的,而物质是运动的,变化是事物的本质。
一切事物都在运动变化,这些运动变化是可以被探知的。大数据,则是及时发现事物变化的一个工具。
3.3 理清关系
美国印第安纳大学的教授约翰·博伦(Johan Bollen),曾发表了一篇文章《Twitter情绪预测股票市场》。这些教授们一直想弄清楚到底是什么因素在影响股票的涨和跌,以及能否预测股市的涨或跌。于是,他们收集了2008~2010年期间在Twitter上发表的上亿条条文,然后做了一个对用户情绪的量化模型,就是根据发表条文的字词来估算用户的情绪,并将其量化为一个情绪数值。一个用户就有一个情绪指标,然后,他们把当天发表条文的所有用户的情绪指标综合起来,最后形成了一个客户群的综合情绪指数。最后,他们把这个客户群的综合情绪指数按照时间的维度连接起来就形成了一条情绪曲线,然后,再把这条情绪曲线和道琼斯指数曲线进行比对。经过不断的优化他们量化情绪的模型,他们很惊奇地发现,这条情绪曲线的波动居然和股票曲线的涨跌有着惊人一致(如下图所求)。
仔细观察一下,下图的情绪曲线与股票曲线并不是完全重叠的,而是,情绪曲线在股票曲线波动的之前。也就是说,当情绪曲线往后挪3~4天以后,情绪的波动和股票的涨跌就基本上吻合了,这也就说明,可以利用情绪来初步判断股票的涨跌,这开启了大数据炒股的新时代。
用大数据的技术语言来说,就是,情绪指数与股票指数的具有相关性。
相关性分析,是大数据时代用得最多的一类分析方法之一,可用来探索事物之间的相互影响和相互制约的关系。
比如,企业的采购、生厂、设计、市场、售后等等,都是相互影响和相系制约的。
唯物辩证法认为,世界上的一切事物都处在普遍联系中,没有任何一个事物是孤立地存在的。联系是指事物之间以及事物内部诸要素之间相互连结、相互依赖、相互影响、相互作用、相互转化等相互关系。
一句话,万物皆有联系!而大数据,成为探索事物间相互联系的一种有效的手段。
3.4 预测未来
大数据的核心是预测。
在2008年,当大多数企业在经济危机中挣扎时,阿里巴巴却相对轻松地地度过了此次危机,因为阿里巴巴提前就预测到经济危机要来了。
他们是如何预测到经济危机要来的呢?其实马云在很多次场合都说过,他说阿里巴巴有两大类重要的数据,一类是交易数据,另一类是询盘数据。询盘数据,指的就是在网站的浏览数据、搜索数据、点出数据等等。
很显然,询盘数据和交易数据是有关系的。首先,询盘量和交易量存在正相关的关系;其次,询盘数据肯定发生在交易数据的前面。阿里巴巴每个月都会对这两大类数据进行统计和分析,找到他们的关系和规律。在2008年的年初,他们发现询盘数据已经持续几个月都在下降了,尽管此时交易数据并没有明显的下降趋势,但基于上面的关系,可预见,在未来的交易数据也肯定会下降。因此,阿里巴巴才作出了“经济危机”的初步判断,然后,再收集更多的数据来验证这个判断的正确性,并进而作了大量的准备,从而安然度过这次经济危机。
大家都知道,大数据分析的是已经发生过的数据,那么过去的数据已经发生了还有什么用呢?其实,大数据只是借分析过去的数据,来探索事物的规律和特征,其目的是为了预判事物在未来的发展变化或发展趋势,
因此,大数据的目的是预测,基于对事物的预测结果,用来作出相应的策略调整。如果预测的结果不是我们想要的,则需要调整相应的策略,施加影响因素,使得事物朝着我们想要的方向去发展。
所以,大数据描述的是过去,表达的却是未来!只有预见未来,才能把握未来!
可见,大数据之所以能够用来进行业务决策,不外乎就是通过对数据的分析,来实现对业务特征、业务规律、业务变化的把握,以及影响业务变化的关键因素进行分析,来达到了解业务,预测业务未来发展的目的。
所以,大数据分析的核心价值,就是去发现数据的特征、变化和关系。
因为数据的特征就是业务的特征,数据的变化就是业务的变化,数据间的关系就是业务因素间的关系。
|