腾讯分分彩组三杀号 > 大数据 >

拄双拐的阿里打假工程师:用大数据锻造出世上最锋利的打假尖刀

2018-07-30 15:05

  摘要:在笑舒和同事们的努力下,他们研发的打假大数据模型每天对整个阿里平台近20亿件商品进行扫描,找出疑似售假商家做出处理,协助执法部门进行查处。

  80年前,人们开始用计算机预测天气。如今,阿里巴巴的年轻工程师们,正用机器学习等大数据方法阻击假货。夹杂在政策、法律、经济、社会发展乃至人性中间,假货治理的难度也许比变化无常的天气更为复杂。

  拄着双拐的笑舒(阿里花名)来自湖北孝感,他是架设打假大数据拦截网的阿里巴巴工程师之一。建设这张“网”的路一点都不平坦,这让他无数次想起10年前,父亲用三轮车载着他上学的那条土路:是“挑战”让人找到自己的价值。

  在笑舒和同事们的努力下,他们研发的打假大数据模型每天对整个阿里平台近20亿件商品进行扫描,找出疑似售假商家做出处理,协助执法部门进行查处。

  笑舒坐在被三台显示器环绕的工位上,与身边的同事一齐修改、调试大数据打假模型。

  “这是主模型,我们应对各种业务场景准不准,今后就看它了。”笑舒说,他和同事们开发的大数据打假模型包含了上千个数据维度,仅代码量便有数十万行。

  笑舒该如何生存下去?一度让在湖北孝感务农的父母感到忧虑。最终,父母决定送笑舒上学。“‘只要你肯学,我就供你读。’这是母亲跟我说过最重的一句话。”笑舒回忆,从初中到高中,父亲每天骑着三轮车接送他上下学。

  “从我家到学校都是土路,父亲送我上学每趟都要骑半个小时,父母很辛苦。所以我对自己很严格,基本上都是年级前五名。”笑舒说。

  2008年,笑舒考入了湖北工业大学,2012年,考入华中科技大学数学与统计学院,并于2014年获得硕士学位。

  “一开始,我打算在武汉找一份工作,很多武汉公司对我简历认可,但一面试便以‘你的身体状况可能不太适合这边’婉拒了我。其实与阿里的工作相比,武汉的那份工作更机械化,没挑战性。或许也不是我想干的,但他们真要录用了我,我现在应该就在武汉了。”笑舒回忆。

  “我在阿里打假不是做‘判官’,而是利用机器学习、做数据模型过滤负向商品和商家,排除潜在风险。”每当有人问他在阿里做什么,笑舒总要把上面的话大致重复一遍。

  大家不懂什么是打假模型,笑舒并不觉得奇怪。因为他和同事们所做的,就是探索一套世界上绝无仅有的假货风控体系--面对近20亿量级的商品,上千万卖家,数以亿计的订单。

  “这种模型,世界上之前没有过。从业界来看,一般利用机器学习做的都是正向模型居多,像营销、推广。但我们做的是负向模型,且是信息量庞大,维度众多的场景。”笑舒说,从他开始研发打假模型便面临众多压力与挑战:打假模型判断不准,出问题他和伙伴们要负责。

  一次有商家被投诉售假,但从信息层面看不出其是否售卖过假货,这时受理投诉的同事调用笑舒研发的假货模型进行甄别,结果模型判断售假嫌疑极大。

  这事之后,笑舒和团队深入分析了原因,发现是作为机器学习的原料--种子数据特征的覆盖面不够。在调整了数据样本、特征和模型后,同类商品的售假判断准确性得到极大提高,得到调用部门的认可。

  好刀都是磨砺出来的。经历了众多挑战后,如今,笑舒和同事们研发的大数据打假模型已应用在神秘抽检、疑似售假商家入驻拦截、售假线索挖掘分析等阿里巴巴平台治理部众多的假货风控场景中。

  “阿里巴巴发布‘打假地图’哪里是‘重灾’省份”、“阿里协助沪警方打假:缴获假冒品牌红酒14000瓶案值逾千万元”,这些新闻报道背后,是这套打假模型在高效运转。

  据《2016年阿里巴巴平台治理年报》显示,从2016年1月至2016年12月,阿里巴巴协助警方抓获犯罪嫌疑人880名;捣毁涉假窝点1419 个;破获案件涉案总金额超 30 亿元。在品牌合方面,这一年阿里巴巴主动拦截删除的商品量是同期权利人投诉删除商品量的26倍。这些数字同样离不开打假模型的支撑。

  笑舒表示,以前他和同事会根据不同的场景、商品数据设计打假模型。这些模型经过一段时间的调试和发育,上线初期命中率很高。然而,众多售假团伙会试探打假模型的能力,进而让假货信息、售假者身份“变异”来绕过监管。

  常规做法是对模型参数、特征和种子数据进行调整,让模型尽快能识别变异的商品信息。但在模型调整期间,不免有漏网之鱼溜进平台。为此,笑舒和同事们正在抓紧调整一个有数十万行代码的主模型,该模型包含了上千个数据维度。笑舒表示,随着这个模型的成熟,阿里巴巴平台治理部拦截和打击假货将更为高效,有望从信息层面让假货从阿里巴巴平台上基本消失。

  虽然能从信息层面消灭假货,但笑舒和同事清楚,线下的假货并不会凭空蒸发。更加严峻的问题,不少线下制假团伙并没有得到应有的惩罚,这就导致平台面对的假货威胁一直严峻。

  “当前打假就像个筛子,刑事判决处罚过低,不足以震慑利润丰厚的制假售假产业链。”据阿里巴巴首席平台治理官郑俊芳介绍,2016年阿里巴巴平台治理部共排查出4495个销售额远大于起刑点(5万元)的制售假线索,而通过公开信息能够确认已经有刑事判决结果的仅33例,缓刑比率近80%。因此,在今年两会期间,马云致信两会代表委员,呼吁“像抓酒驾一样治理假货”,引起全社会强烈反响。

  “‘像抓酒驾一样治理假货’最终目的是让售假者得到应有处罚,减少社会上的假货。我们团队最大的KPI(绩效指标)应该就是利用打假模型,为全社会营造出‘无假’的贸易环境。”说起即将到来的2018年,笑舒表示他最大的心愿是父母平安健康,天下没有假货。