阿里“神盾局”如何用大数据打假
作 者:吴琳琳 来 源:北京青年报发表日期:2014-12-26
“阿里巴巴首席风险官邵晓锋昨天披露,经过多年与制假售假者的“暗战”,阿里巴巴已经构建起一套全球领先的基于互联网大数据的打假模式,从2013年1月1日至今年11月30日,阿里集团在消费者保障及打假方面的投入已经超过10亿元人民币,并配合行政执法部门办理侵犯知识产权案件1000余起,涉案金额近6亿元。”
海量的假货数据,仅依靠阿里2000多人的消费者保障和打假团队人工操作,是不可能完成的任务。阿里巴巴首席风险官邵晓锋昨天披露,经过多年与制假售假者的“暗战”,阿里巴巴已经构建起一套全球领先的基于互联网大数据的打假模式。“我们的打假模式是向社会开放的,欢迎更多的平台、商家、权利人等利用这套模式,从源头打击假货,还给消费者一个安全、透明的购物环境。”邵晓锋表示。
据悉,从2013年1月1日至今年11月30日,阿里集团在消费者保障及打假方面的投入已经超过10亿元人民币。今年前三季度,阿里配合品牌权利人年处理600万条侵权商品链接,配合各级行政执法部门办理侵犯知识产权案件1000余起,抓获犯罪嫌疑人近400人,涉案金额近6亿元。
大数据如何追踪售假者行为?
阿里巴巴自成体系的打假模式,最核心的部分是大数据打假。简言之,就是通过智能识别、数据抓取与交叉分析、智能追踪、大数据建模等技术手段,将假货从10亿量级的在线商品中捞取出来。
以往排查假货信息是靠搜索关键词来确定的,这么做工程量大,准确率低。这两年,阿里巴巴安全技术人员开发的文本识别引擎已经升级为语法语义分析,在引入了机器学习算法后,能够取代之前的人工排查,做到全网数据监控和检索,支持多达60个维度的组合条件筛选,每天消息处理量2亿条以上。
2013年开始,阿里巴巴逐步建立了全球最专业的图片侵权假货识别系统,通过图片算法技术实时扫描,可以通过检测图片中的局部Logo来识别图片中商品的品牌,进而判断该商品是否为假货。目前淘宝收集的各类违规假货样本的图库在100万左右,系统每天调用超过3亿次。
但是随着技术排查能力的升级,售假者也在不断变换手法。有的淘宝卖家在发布宝贝描述的时候,既没有使用盗用的品牌名称,也没有上传带有明显Logo的照片。在这种情况下,阿里巴巴通过用户上传的评价截图,大数据系统照样能发现商家售假的异常行为。阿里巴巴安全部资深总监倪良表示,发退货、登录IP、商品文字、图片描述、交易、消费者评价、维权,权利人投诉,甚至是社交媒体数据等16个维度和特征的数据在被提取和交叉分析后,从中剥离出涉假信息。
开店要进行“动作认证”
网络DNA认证体系、神秘购买抽检机制等一系列的动静态管理保障体系是阿里巴巴防控假货的第二道闸门。
淘宝网针对卖家的实名审核越来越严格,正在从“实名认证”向“实人认证”迈进。一名资深淘宝卖家表示,以前淘宝开店只核查身份证号码,后来要本人拿着身份证拍照,但还是有人通过买卖身份证号和假照片蒙混过关。今年淘宝的实名认证又升级了,根据用户不同情况,额外要求指定手势拍照、手持当地报纸拍照,甚至“小二”电话核实等。其中指定手势库有数十种随机手势,不定期地进行手势更新,最大限度避免造假者钻漏洞。
倪良介绍,淘宝的开店实名制目前有18道审核程序,未来还将逐渐开发人脸和声纹特征数据库。
除网络DNA认证体系保障外,阿里巴巴专门成立了一支总数超过7000人的知识产权保护管理团队,由公司工作人员和志愿者组成,每天在网上巡逻举报侵权假冒商品。同时,阿里巴巴启动神秘购买抽检机制,由数千名网络志愿者以普通买家的身份购买大数据分析追踪的嫌疑商品,权利人和第三方检测机构对商品真伪和质量进行鉴定和检测。
“神盾局”联动多部门 线下打击假货
只有卖假货的人付出应有的代价,假货才会越来越少。根据《2014淘宝联动警方打假报告》的数据显示,截至今年12月12日,阿里巴巴联动各地公安机关,破获18个制假售假集群,端掉200多个窝点,抓获犯罪嫌疑人近400人。
阿里巴巴集团安全部在内部被誉为“神盾局”,是一支涵盖数十项重要职能的知识产权保护专业团队。除了常规的技术人员,阿里“神盾局”的“特工”中有不少能人,包括全国特级优秀人民警察一等功荣立者邵晓锋,有着10多年刑侦经验的破案能手倪良、徐平,刑事情报高级工程师徐世土等。“阿里巴巴安全部的人力配备,不亚于一个省级公安的侦查大队。”浙江省公安系统的一位人士称。
阿里“神盾局”还有一个反黑客团队,吸纳了很多在安全攻防界响当当的人物,比如安全攻防领域资深专家肖力,以及《白帽子讲安全》作者、江湖上声名显赫的道哥吴瀚清等。此外,阿里巴巴还招募了来自全国各地各行业的5400多人的志愿者队伍,负责配合进行日常线上巡查和抽检等。
邵晓锋透露,2015年阿里巴巴有望推出与国际接轨的“三振出局”制,即就同一权利对同一卖家的投诉成立达三次,该商家将被永久冻结,以实施对重复侵权商家的更加严厉的违规处置。同时,阿里巴巴计划发布“全国线下假货分布及流通地图”,全面客观地展现线下假货分布情况,并对重点区域、类目等信息进行注明。
新闻解密
阿里“神盾局”的“八大神器”
神器一:图像识别技术
消费者经常遇到这样的情况,一家网店写的是“奢华男手表”、“瑞士机械表”,而实际上卖的是伯爵,但这手表的标价只有2580元。这样的店铺实际上已经进入了阿里巴巴的“疑似假货图片库”。阿里巴巴已收集的类似的图片在100万张左右,每周发现疑似假货的数量在10万至20万件之间。
在商品被判断为“疑似假货”之后,会被下架删除,而同时商家可以自己举证来证明商品是真货,例如出具正规商家的进货单、发票等。如果举证有效,那么店铺会被重启,正常营业。
神器二:商标检测技术
怎么识别T恤上的假爱马仕标志呢?第二大神器:商标检测技术就出场了。
商标识别算法可以通过检测图片中局部的Logo来识别图片中商品的品牌,进而结合其他运营规则来判断该商品是否为假货。对于一些较难检测的情况,还设计了一套商标主动发现的算法。目前,阿里巴巴对知识产权重点的五个类目大约16亿商品图片建立了商标索引,可以快速定位包含某个品牌Logo的所有商品。
神器三:光学字符识别技术
目前,阿里巴巴的光学字符识别技术可以识别图片中的文字信息,通过识别“低价折扣”、“正品保障”等关键词来辅助假货识别,准确率达95%以上。
神器四:DNA认证系统
在淘宝,网店名字、ID可以注册多个,但是每个人的身份证号只有一个。阿里安全部就是根据这个不变的要素,在注册开淘宝店的时候,淘宝会要求店主上传手持身份证,并且采取指定手势拍照等方法,对那些作弊者追根溯源,协助公安、质监等部门一举端掉制假售假的源头。
神器五:IPR权利人投诉平台
怎么才能最大范围地识别“假”呢?2011年,阿里巴巴推出IPR权利人投诉平台,通过这个平台,权利人(包括品牌商、专利所有者等)可以向阿里巴巴举报具有侵权嫌疑的商家,阿里巴巴也会根据权利人的信用调整不同的处理速度,从这个角度看,也是一个双方的信用平台。目前,阿里巴巴的IPR权利人投诉平台拥有全球最大的权利人注册体量,1000家合作的品牌商达成了深度合作。
神器六:“海底捞”
在阿里巴巴平台,有数以亿计的活跃买家,这些买家也是阿里安全部判断是否“疑似假货”的依据之一。
这种被戏称为“海底捞”的技术实名是数据提取和交叉分析。阿里巴巴利用“海底捞”的各种模型,捞取主动防控所需信息,使得平台假货得到管控、消费者利益得到保障。而哪些属于“海底捞”呢?消费者来电、退款、维权、规则投诉、云客服咨询、评价信息、315网站投诉、线上假货举报等等这些都属于“海”的声音。
神器七:智能追踪
对阿里神盾局来说,网络购物有自己的“码”。所谓的“码”,包含了店主本人的信息、登录的IP地址等等。当一件商品出现“疑似假货”问题时,“码”的作用就显现出来了:可以进行店主信息等的追溯,并且通过商品的退发货地址,追溯到涉假人员的假货仓库地点。
神器八:生物识别技术
现在,阿里巴巴平台的技术可以识别这家店是谁开的,即一旦出现假货,可以追根溯源找到店主。那么,如果是用买来的或者花钱找几个路人甲,用他们的身份证登记店铺呢?未来,生物识别技术将帮助杜绝这种情况——当系统识别不再是识别一个静态的证件,而是识别具有独一无二特征的人脸、指纹等生物特征时,造假的可能性就大大减小了。