百度“软硬双施”
作 者:肖婧 来 源:商学院发表日期:2015-02-09
2015年,“百度大脑”正在人工智能军备竞赛中的全面冲刺。“过去20年里人们已经看到人工智能的正循环:如果你有一个好的产品,你就会得到大量用户,有了大量用户你就会有大量数据,这些大量数据用于人工智能算法,你的产品就会更好。但是,传统的人工智能算法的问题在于:当你给他更多数据,效果并不一定一直变好,而百度大脑的新算法是适度学习,当你给他更多数据,效果变得越来越好。”吴恩达表示。2014年1月,百度CEO李彦宏宣布将建立公司历史上首个前沿科学研究机构——深度学习研究院(Institute of Deep Learning,IDL)。5月,百度在硅谷设立人工智能中心,并聘请了前Google人工智能部门创始人之一——吴恩达(Andrew Ng)担任负责人。吴恩达是世界三大人工智能专家之一,并且是三人中最年轻的一个。另两个是杰夫·辛顿(Geoffrey Hinton)和伊恩·勒坤(Yann LeCun)目前分别受聘于谷歌和Facebook。吴恩达近日在接受采访时称,目前百度的IDL团队主要攻关的是语音和图像识别,并兼顾BaiduEye等智能硬件的进一步研究探索。“在移动互联网的时代,用户需要用更自然方式使用互联网,所以大数据,语音、图像、自然语言的处理以及用户用自然方式找到服务至关重要,而拥有海量数据和人工智能新算法的百度大脑已经有能力使人工智能正循环越滚越快。”吴恩达说。
搜索回归“说”与“看”的原生世界 随着移动互联网的发展,搜索给了用户新的可能性。李彦宏在2014年百度世界大会上透露,未来五年语音和图像搜索会超过文字。“目前百度10%的搜索请求来自语音搜索,一天可以最高达到500次,其中400次以上的语音搜索来自儿童。” 李彦宏解释说,语音是一个更加自然的表达需求的方式。“文字的历史大约只有5千多年,但语音的历史至少有20万年,它是一个更加自然且低门槛的表达方式,一个儿童在还不会打字的时候,就已经可以用语音来表达他的搜索需求了。”李彦宏举了一个语音搜索的案例:“‘7年前姐姐的年龄是妹妹的4倍,7年后姐妹俩的年龄之和是48岁,姐姐今年多少岁?’以上语音搜索内容可以推测是一个小学二年级的学生输入的。反观如果使用文字输入的话,所需的时间可能比算出答案还要长,很可能干脆不去搜索了。”“说”之外,“看”有着更丰富的形式——图片。现在的百度同时也支持拍照搜索,或是用一个图片去找相似的图片。“一个人在学会语言之前,是先用眼睛认知世界的。图片搜索推出后,很多用户都开始用这种更自然的方式来向百度表达需求。”李彦宏谈到,其实表达需求最多的一个类型是跟生活方式相关的,购物需求的图片搜索占到了35.5%,比如把一个包拍下来看看网上哪有卖。”可以这样说,搜索技术的门槛一直在上升,从文字到语音再到图片,而使用者的门槛一直在降低,即使一个婴儿也可以用他的眼睛来表达需求。“未来5年,我认为使用语音和图片搜索的请求量会超过纯文字的需求量。”过去一年百度语音方面的探索取得巨大进展。目前,百度搜索中有10%为语音搜索,此外如地图定位和百度语音助手都有百度在语音上的成果,围绕语音界面重新设计移动产品,推动物联网的革命,让汽车界面、家用设备、可穿戴设备都离不开语音。
李彦宏的新大陆 “开放云”“数据工厂”和“百度大脑”被称为李彦宏的新大陆。百度高级副总裁王劲介绍,百度的大数据引擎由这三项核心大数据能力组成。此前百度在公布“百度大脑”项目时,宣布该项目已能模拟人脑的200亿个神经元,达到两三岁孩童的智力水平——这意味着百度的进度在不声不响中做到了全球领先。以算法为基础的“百度大脑”则是人工智能、深度学习的代表,目前百度人工智能方面的能力已经开始被应用在语音、图像、文本识别,以及自然语言和语义理解方面,“等于(机器)有了眼睛、耳朵、嘴巴。”王劲说。当你被一片不认识的美丽花田倾倒,在过去只能是拍下照片就没有“然后”了,现在通过照片,百度大脑让你既知道花名,还能得到服务:百度百科告诉你这个花名及它的相关属性,同时百度直达号帮你找到离你最近的有这种花卖的花店。王劲表示,受益者还有商家,“对于花店来说,过去只能是有顾客来到店里,才能把花卖出去,现在整个大自然都是它的橱窗,商家能够非常准确地捕捉商机。”大家都有这样的经历,在某个地方突然听到一首非常好听的歌, 想知道这是什么歌?是谁唱的歌?“这时你只要拿起手机,百度大脑就会告诉你。如果你是喜欢音乐的人,可以通过百度直达号到音乐网站下载这首歌;如果你是歌手的粉丝,直达号会告诉你:比如过两天他要到你所在的城市开演唱会,同时你可以找到对应的票务公司下单并选定座位。”王劲说。除了更好地满足娱乐相关的诉求,百度大脑还能对我们生活中更重要的事情起到帮助,比如老百姓特别关心的医疗。“我们最近跟医疗行业有了很多的合作,比如目前百度和祥云医院有了一个初步的合作——在网上提供皮肤病的预诊。”王劲谈到,过去一个新生的小宝宝皮肤出了问题,年轻的父母会非常焦虑,他们不知道这个问题有多大、多严重、多紧急,也不知道他们应该做什么样的应急处理。而今只要把患病部位用手机拍照并上传到百度,就可以得到一个预诊的诊断。“现在预诊的准确率已经达到93%了,虽不足以成为一个正式的医疗的结果,但可以第一时间帮助这些父母做初步的处理建议,同时也能帮助他们解决之后去找什么样的专家来治疗孩子的问题。百度大脑能够把一个线下服务和患者对接起来。”“除了看得见的服务器和云计算中心,更重要的是背后看不见的被称为‘深度学习‘的人工智能算法。”王劲解释说,把普通的CPU服务器、ARM服务器和GPU的服务器整合在一起,构成大规模的集群,把它用在人工智能的算法的时候,整个计算的能力、存储的能力达到了一个新的高度。“我们用这个集群打造了世界最大规模的深度学习神经网络,它和传统机器的区别在于:传统机器的学习只是一味扩大它的数据规模,且层次只有一层,而深度学习的算法更好地模拟人类大脑的思维和学习过程,能够处理更复杂的事务。”王劲表示,把百度大脑的人工智能技术和百度的大数据结合,能够找到以前所不知道的规律,从而尝试做一些对于未来的预测。“现在我们已经能够为中国疾控中心提供流行病的预测。另外,我们还能够预测两星期内国内各个城市的旅游热度,让旅游者更好地规划出游,也能帮助相关单位做好宏观调控。”2014年6月,百度甚至还和全球另4家高科技公司——谷歌、雅虎、微软、高盛对世界杯的结果进行了预测竞赛,结果它的准确率是最高的。
另一个商业化触角:智能硬件 基于“百度大脑”的技术支撑,百度世界大会上发表了多款智能硬件,其中以BaiduEye和百度“筷搜”最吸引眼球。“百度筷搜”被李彦宏认为是“新的感知世界的方式,是用户和消费者表达需求的方式”。BaiduEye是百度研究院副院长余凯带领的IDL(深度学习实验室)牵头研发的智能穿戴设备,它的噱头是“无需屏幕,隔空辨物”——没有眼镜屏幕,佩戴者只需要用手指在空中对着某个物品画个圈,或者拿起这个物品,BaiduEye即可通过这些手势获得指令,锁定该物品并进行识别和分析处理。比如:你在街上看到别人身上好看的某款衣服时,手指轻轻一圈,BaiduEye会立即根据衣服特征,搜索到相关品牌以及最近的销售促销信息等;你在博物馆欣赏一个瓷瓶时,BaiduEye会在耳边讲述瓷瓶的历史知识;你看到一棵不知名的植物时,BaiduEye会告诉你它的名称、产地、生活习性等信息;你如果要去某一个地方,BaiduEye将判断你所处的位置迅速找到最佳路线,并启动语音导航。“BaiduEye不是眼镜,而是人眼的自然延伸,让人具有‘看到即可知道’的能力,因为没有屏幕遮挡,戴着它的人也更加轻松,不会因为用眼过度而感到困乏。” 负责研发BaiduEye产品的IDL工程师解释说。据余凯介绍, BaiduEye是一款连接线上与线下、针对O2O场景的产品,目前它的使用场景专注在两个方面:商场购物和博物馆游览。余凯以合作的银泰百货为场景描述:你来到银泰,佩戴上BaiduEye就可以随时搜索货架上商品的信息以及网络上对这个商品的评价,BaiduEye会记录下你的年龄、性别、你放弃和购买了哪些商品、在哪一些货架停留的时间最长……在这些信息的基础上,向你推荐相关商品和打折信息,甚至根据你已经购买的上衣推荐搭配的裤子——它就在这家商场的另外一家门店出售。“我们目前主要考虑的是to B的环境。BaiduEye的图像识别都是通过百度大脑来完成的,它可以在后台进行大量的数据分析,再推送到BaiduEye中。商店一般在收银的地方都有一个小货架,让你在排队结账的时候再买点东西,而使用了BaiduEye的商家则可以根据你在整个店面里所有的关注行为,为你提供一个你私人定制离店货架。”余凯还透露,百度投资了一家室内定位的公司,通过和手机结合,BaiduEye可以为顾客提供语音室内导航,同时让商家知道消费者在这个商场里面的走动轨迹。“银泰可以通过数据进行商业决策,比如怎么安排消费者在商场的路线,把到商场里面的购买行为全部打通,未来购物体验会非常不一样。”银泰商业CEO陈晓东表示,BaiduEye解决了传统零售体验中消费者和商户都“看不见”的问题:用户不知道眼前的商品是不是新品、是否打折、价格、做工、原料;商户不知道用户的喜好、信息和消费记录。“有了BaiduEye,这些数据都可以双向沉淀下来。”如果说BaiduEye是一款相当前卫的产品,那百度“筷搜”可以说是令千百万关注食品安全问题的中国消费者翘首以待的一款产品:它底端集成了四颗传感器,分别可以监测油脂、盐分、PH值和温度。“如果发现了地沟油,或者水质有问题,筷子顶端的红灯就会闪亮起来,”“筷搜”产品经理解释说,“其他更多的信息会通过蓝牙和手机同步”。“筷搜”与普通筷子的重量没有明显区别,充电通过一个“筷笼”:茶杯大小,搭上去就可以充电。“筷笼还有更神奇的作用,可以识别放在上面的食材成分。”“筷搜”工作原理相当于建立了食品健康的大数据分析库,基于云计算,将采集到的数据进行实时分析,转化为各项食品安全指标。但它的实用性却遭到不少业内人士的质疑,百度方面随后承认了这一点,称目前地沟油检测的成功率还比较低。“‘筷搜’主要是想让大家理解大数据未来能做到什么。”“筷搜”产品经理说。在“百度筷搜”的背后,是百度围绕“百度大脑”人工智能逐步打造智能硬件生态的野心。智能化之后,硬件具备连接的能力,实现互联网服务的加载,形成“云+端”的典型架构,具备了大数据等附加价值。“因为百度对数据和基础设施的投资,让我们有能力利用人工智能进行互联网的转型,正所谓,赢得人工智能就赢得互联网。”吴恩达说。BaiduEye不是眼镜,而是人眼的自然延伸,让人具有“看到即可知道”的能力,因为没有屏幕遮挡,戴着它的人也更加轻松,不会因为用眼过度而感到困乏。