解密大数据:为什么沃尔玛会把啤酒放在尿不湿旁边?

另一种“数据”却掩藏在现象背后,且难以找到因果关联。比如蛋挞的销量与飓风天气有关,啤酒放在尿不湿旁边会卖得更好。在这里,我们不一定非得知道为什么飓风一来蛋挞销量就会上升,只需要知道两者之间存在这种关联即可。

大数据不关心为什么,只关心是什么,它从因果关系变成了相关关系。”在最近中欧Global EMBA举办的智能大数据讲座中,中欧Global EMBA2000届校友佘晖、极光大数据联合创始人及总裁陈菲以及数智匠人基金创始合伙人王春辉一起为大家解密了当下的大数据时代。

什么会促进蛋挞的销量?是活动或Party吗?不,答案是飓风,飓风天气下蛋挞总是更受欢迎。沃尔玛黑啤啤酒与哪类产品摆放在一起时会卖得更多?是其他酒类或是下酒菜等食品类吗?不,答案是尿不湿,父亲们在购买尿不湿的时候总是喜欢再买些啤酒。

这些事物彼此之间看似毫无关联,甚至有点匪夷所思,但却是世界百货公司巨头沃尔玛经过大量数据分析后得出的结论。事实证明,这样的结论并非偶然。

传统的营销手段需要决策者们思考事物之间的逻辑关系,一本育儿类书籍的购买者,常常会得到关于另一本育儿类书籍的推荐。而在大数据时代,一切就交由大数据来处理。蛋挞销量与飓风之间的相关性是通过对海量数据的分析所得出的结论。

大数据简化了决策流程,不需要看“为什么”,只需要看“是什么”。它从因果关系变成了相关关系。

“大数据”指大小超过了现在典型的数据库软件和工具处理能力的数据。“大数据”到底有多“大”呢?人们过去所熟知的数据量单位可能是KB、MB、GB等,然而截至2012年,数据量已经从TB(1024GB=1TB)级别跃升至PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。

二线万GoogleGlass用户录制一小时视频就可以产生100TB的数据量,这些都是我们所称的“大数据”。在整个行业中,数据量最大的是互联网,中国数据量最大的公司当数BAT(中国互联网公司三巨头:百度、阿里巴巴和腾讯),其次为运营商和金融公司。

对于现有数据库而言,数据处理的瓶颈就是100TB。当数据量超过100TB时,现有数据库技术就已经没有办法处理了。

根据储存形式,数据可被区分为结构化数据与非结构化数据。结构化数据用表格的形式来存放。一般情况下,企业中的财务部门、人事部门以及银行系统等使用的都是结构化数据,它是当前处理数据的主要方式。相应地,非结构化数据指的是那些不能用表格的方式来存放的数据,例如照片、音频、网页等,而当前的数据库能力还不足以处理非结构化数据。

随着科技的发展和智能产品的普及,非结构化数据的数据量远远超过结构化数据,这个比例目前已经达到了20:1。对非结构化数据的处理是社会发展的必然趋势,在原有数据库能力不足的情况下,“大数据”及其相关的新兴技术为非结构化数据处理提供了可能性。

提到大数据,一个不得不说到的技术名词就是Hadoop。Hadoop是一个分布式系统基础构架,简单来说,它可以把一个应用能程式分解并进行同时计算。 Hadoop技术的出现使得数据库对于数据的处理能力得到了大幅提升。

Visa公司处理两年730亿单交易的时间由过去的一个月缩短为13分钟;一个国内公司分析数据的准备时间由11个小时减少为几分钟。

在应用领域内,大数据对用户喜好的分析及相应推送可能会让很多人误以为大数据是2C的,但这只是整个大数据产业其中的一部分,而为整个数据产业买单的,最终还是企业。从本质上看,大数据是一个2B的业务。

大数据也更多地遵从2B行业的特性。首先,大数据的交易多发生于几个公司之间,而不是面向个人。其次,大数据作为一项商业活动,排除了2C业务中的非理性成分。更重要的一点是,大数据还有一个特征,就是它所涉及的维度很多,数据量“大”仅仅是大数据的一个方面,而一个能够看到公司现实状态的“活”数据才能真正促进交易,产生价值,并用它来提高运营效率,给公司竞争力升级,这才是大数据的真实意义。

沃尔玛的“蛋挞与飓风”营销手段只是大数据应用其中一个小小的案例。在前期,大数据服务可以帮助企业进行客户调查,从而对竞争对手做出分析,并完善本公司业务的运营方案。

而对于用户的精准分析,可以更好地为企业的业务招揽用户,提高投资回报率,同时也能在运营阶段提高企业与用户的连接度,让用户更加活跃和依赖企业相应的服务。

当海量的数据能被一一分析、存储,而不是抽样时,许多过去的难题会迎刃而解,基于大数据的预测会比人们的经验、逻辑判断更精准,甚至于医生、律师这些行业,也会因为大数据对海量案例的分析处理能力而在未来的某一天被替代。

大数据目前正处于一个爆发式、井喷式发展的状态。大数据促进了大量创新应用的发展,这些应用的出现在短时间内就会在行业内被复制。资本市场的追捧也是大数据发展爆发式发展的重要因素之一。

从行业角度来看,继云计算等技术之后,大数据作为一项全新的技术已经成为下一个热点,这意味着过去的技术人员已经不能够满足当前的市场需求,

另一方面,伴随着中国经济的放缓和企业的日益成熟,未来的十年将是中国数据产业从萌芽走向繁荣的十年。中国数据产业的发展将经历一个“自下而上”的过程,各行业间先形成自己的基础,再慢慢形成市场。中国目前还处于一个数据收集的阶段,但收集完数据后让企业接受和应用还需要一定的时间和过程。

由少数几家企业整合市场数据是第一步,其次是对数据的深度加工并提供相应服务,当传统企业也开始建立起数据能力时,数据产业将会趋于成熟。

大数据投资人最看重的是创业团队中的“人”,这也是所有投资人考虑的第一点。行业经验、运营数据的“基因”,作为领头人的行业能力和“匠人”精神,甚至是个人品质,都是非常关键的。其次还要看这个创业团队的目标市场是不是足够大,即使一个团队能在行业中做到最优,但规模却只有几亿美元,这是不能得到投资人青睐的。此外,因为美国在大数据领域处于领先地位,有没有美国的对标企业也是考虑的因素之一。

从商业模式来考虑,真实、独特的数据源、他人难以进入的产业壁垒、盈利和变现能力才会让一个团队的业务具有生命力。当然这其中还要有技术方面的考量,行业技术的能力必不可少。

更多精彩尽在这里,详情点击:https://dutchsimulators.com/,奥斯本

发表评论

电子邮件地址不会被公开。 必填项已用*标注