迎接数据科学的拐点
作 者:周庭锐 来 源:商学院发表日期:2014-12-22
2014年,我们一起见证了数据科学(data science)在全球范围内的迅猛勃兴,而中国,毫无例外地参与了这场盛会。数据科学是大数据时代里,面对波涛汹涌、排山倒海而来的海量数据,通过超高速计算,对人事时地物甚至隐含概念进行探索挖掘、特征识别和统计分析的科学,这种科学曾经是极少数武功高强科学家的专利,但是由于世界上还存在一些为数更少但能明察秋毫洞烛未来的资本家,他们很快就理解到这种新兴科学的商业价值,于是在风险资本的推动下,让这些科学家摇身一变成为新兴科技的企业家,这其中一部分人,例如扎克伯格、贝佐斯,已经是纳斯达克天空的闪耀星星,但是还有更多的人正站在风口上,盼着忽然而至的东风,让他们刹那间就能翩然飞翔。阿里巴巴可能是其中相当璀璨的明星之一,从事电子商务,在中国蹲伏了14年之后,成长成一只年营业额高达2480亿美元的庞然巨物,并一举在纳斯达克IPO套得218亿美元,轻易秒杀稍早京东商城18亿美元的意气风发。事实上阿里巴巴所赖以为生的并不是电子商务,而是电子商务背后带来的数据流,通过对这些数据流的拦截与计算,衍生出包括对零售与物流商家的种种数据服务,以及针对卖家与买家设计的各式各样金融商品。阿里巴巴成功上市的意义并不仅仅只是让华尔街一众白皮肤的投资人狂野高喊“爸爸”而已,它代表着中国电子商务发展的一个里程碑。而从“网络外部性”的效应看,这很可能也是中国电子商务发展的分水岭,从此再难有第二家能够做到这种规模的“纯”电商。
非纯电商的O2O实践 事实证明,我们在2014年开始看见大量“不纯”电商的兴起,他们誓言要让“纯”的传统电商从中国版图里消失。例如地产商万达在他的商业卖场里广泛布下wifi的天罗地网,通过记录商场顾客的手机号码,捕捉他们在卖场里从两脚移动到心智选择的消费轨迹。实际上万达的策略目标远不仅止于此,在部分城市里万达已经开展O2O实验,希冀融合对线上线下消费行为的分析与理解,做真正全渠道的生意;类似的故事正在全国范围里此起彼落地上演:步步高开始经营云猴电商开放平台;大润发凭借自己商超模范生的身份,一方面在天空放出飞牛来攻击阿里巴巴的天猫,另一方面还同时拉开“千乡万馆”计划,渗透进小区服务中心,打算在地面打造1万家网络体验馆,形成以小区为核心的O2O闭环,垄断线上线下所有的消费数据。这股风潮连物流业者顺丰也坐不住了,嘿客一出手就是500家门店全国同时开业,充分利用他们在城市物流的优势,通过二维码构筑绵密的、超低运营成本的城市自动售货亭(city kiosk)网络。实际上,中国所有行业里的玩家几乎全都急不可待地抢着加入这场竞争。先不提那些不间断地侦测用户行为的服务类运营商,例如百度、腾讯、360、三大电信公司等等,他们早就从方方面面各种生活切入点布下天罗地网来拦截广大用户每天所思所想所问所求的信息;现在连传统制造业都已经大张旗鼓地对电商发起绝地大反攻。例如海尔的空气盒子、小米内建的用户监测系统、众多家电厂商正在寻思的结合wifi的智能家电,在打着捕捉用户数据的如意算盘,希望通过对用户行为的持续监测与随之而来的深刻理解,实现他们隐秘不宣的赢利策略。这是2014年在中国市场里如火如荼的实况。2014年是中国厂商意识到消费者数据价值的元年,而展望2015年,厂商对消费数据真正的深刻解析才刚要开始。
对大数据解析的不足 到此为止,绝大多数中国厂商对于数据解析的理解,还停留在算算百分比、看看时间轴上的数量趋势、至多加上点均值计算,如此而已。就连行业里的模范生淘宝天猫所提供的数据魔方都仍然停留在这点水平上。相对而言,百度可以算是个异类了,在各种预测上算尽了作为坐拥大数据大牛公司的基本责任。坐拥大数据的目的是为了预测,通过过去的已知来预测即将发生的未知,而不仅仅只是描绘现况而已。真正坐拥大数据是为了从这些浩如烟海、快速积累、驳杂不纯的数据里寻出蛛丝马迹,作为制定企业策略的依据。这些蛛丝马迹,例如小至消费者在商场里被摄像头捕捉到的一颦一笑、通过手机声纹监听搜集到的抑扬顿挫、上传微博论坛照片颜色的调性、最近贴上微博文本里的轻声叹息、甚至可穿戴设备监测到的皮肤电位差、脉搏速度、体温、行为活跃度等等,都可以通过数学模型转化为对人们情绪的估计,像这些隐微的估计才是数据科学家们最感兴趣的课题。
知微才能见著 对消费行为蛛丝马迹的掌握是成就伟大企业的基本能力。商人察言观色掌握客户情绪的目的是顺水推舟,和气生财,所谓“龙之为虫也,可扰押而骑也。然其喉下有逆鳞径尺,人有撄之,则必杀人。人主亦有逆鳞,说之者能无撄人主之逆鳞,则几矣”(《韩非子·说难》),就是这个道理。何况数据挖掘更不限于情绪估计而已。例如通过网络爬虫爬取电商销售数据、商品热卖排行,我们可以非常容易地通过数学模型来估计品牌、定价、促销、具体商品的种种细部设计等等因素,是如何对销售构成影响的,通过这样的计算我们甚至可以确保实现零库存的可能。不论是情绪还是影响销售的因素,我们都在寻找一些幽隐微小但是意义重大的信息来帮助我们做出正确的企业决策。营销的基本制胜原则在于高筑竞争壁垒,而有效的竞争壁垒必然是基于竞争对手难以捕捉的,甚至是无法觉察的信息。那些百分比、具体数字、甚至是均值,都是很容易被看见、被理解的强信息(strong signals),这样的信息我们知道,竞争对手也知道,所以策略价值不高;反而那些被杂讯淹没的、数量微小的、刚刚萌芽的、很容易被忽略的弱信息(weak signals),更可能是具备重大策略价值的信息。数据科学提供我们这样的机会,从海量数据中去发掘隐微但是具有重大策略意义的信息,然后在竞争对手还毫无所知的情形下,突出奇兵,直接占领整个利基市场。
旁注: 营销的基本制胜原则在于高筑竞争壁垒,而有效的竞争壁垒必然是基于竞争对手难以捕捉的,甚至是无法觉察的信息。
- 相关文章
-