时间:2023-01-27 20:56:01 | 来源:电子商务
时间:2023-01-27 20:56:01 来源:电子商务
近年来全球欺诈趋势如何演变?潜伏在流量中的欺诈行为有哪些特点?无监督AI技术如何帮助企业风控管理者提升效率?其原理如何解释?如何利用无监督技术建模?
近日,DataVisor维择科技中国区技术负责人崔宏宇做客“51CTO大咖来了”,就上述问题带来分享。现在就让维择课代表带你回顾直播精彩内容吧!
传统行业数字化转型中面临的风控挑战
如今,各大传统行业纷纷开始数字化转型,希望能够借助互联网浪潮加速自身发展。然而传统行业与互联网行业本身存在很大不同:传统行业缺乏互联网基因,对互联网风险的认识也有待加强,因此在转型过程中面临着诸多挑战。
互联网飞速发展使得欺诈模式更加复杂
随着移动互联网技术的发展,单一功能网站转型多功能平台,线上交易行为可能会受到来自多方的有组织攻击,比如撞库、盗号、薅羊毛、虚假粉丝、虚假好友、虚拟货币、洗钱、交易欺诈、钓鱼攻击等。欺诈手法多变,甚至出现多环节联动的情况,多数欺诈行为还会潜伏较长时间来模拟正常客户的行为,使普通风控系统无法检测出异样行为,风控环节面临着巨大挑战。
金融行业在数字化转型的过程中业务范围越来越广,各个环节都存在着被黑产攻击的可能性。在申请阶段存在恶意逾期、中介代办、团伙欺诈等风险;在交易环节中,常见的有盗卡盗刷、养卡套现,甚至洗钱行为;营销阶段的欺诈更加严重,很多金融机构为拉新用户,给新用户发放红包奖励,但是这些奖励很多情况下都流入了黑产的口袋,金融机构因此遭受损失。黑产活动已经渗透到金融业务全流程,这对传统金融行业的风控能力提出了更高的要求。
那么,为何传统金融行业在转型过程中更容易遭到黑产威胁?
崔宏宇说:“打击黑产的过程就是风控人员和黑产之间的一场博弈。”我们可以从三个方面进行解读:
首先是利益驱动方面,黑产的欺诈行为会带来巨大的经济利益,同时受巨大利益驱使会产生罕见的积极性和驱动力,而风控从业人员相对利益奖励远远不足。
其次在分工合作方面,黑产已经形成专业、分工明确的产业链,产业交流频繁,对新技术非常敏感且快速学习迭代。而风控在企业中为成本中心,受预算限制,团队规模相对较小且同行技术交流也没有那么频繁。
最后,黑产仅需在风控体系中寻找个别漏洞即可大规模复制盈利,实现“一招鲜,吃遍天”的单点突破。而对于防守方来说,风控人员需搭建全面风控管理体系,任何一块防范不到位都会出现明显“木桶效应”,做到段时间内拦截欺诈是十分巨大的挑战。
知己知彼:揭秘黑产技术及其新型攻击手段
黑产产业链条
黑产分工逐渐精细化,形成了完整的上、中、下游的产业链条:黑产攻击的第一步是进行大规模恶意注册,然后利用群控软件进行同屏传输与批量控制、自动化运行、虚拟定位、一键新机串号设置、定时任务、万能表单输入、手机分组管理、万能脚本/自定义脚本等手段实现套利。另外,技术迭代后为减少成本,黑产利用安卓模拟器可以在PC端模拟任意手机、修改设备参数、多开模拟、虚拟定位,提高其效率减少人力成本,形成了完整的产业链。
崔宏宇介绍道:“有一部分黑产专门向不法分子提供普通用户个人身份信息,例如将身份证、银行卡、预留手机号、银行U盾打包成四件套,售价800到1000多元不等,这些信息被卖给违法犯罪份子,用来进行虚假借贷等操作,从而获得巨大利益。”
黑产常用工具有猫池、清机软件、安卓模拟器、群控软件、GPS模拟器、云手机等等。
猫池(配合养卡软件)
利用群控软件同时控制多部手机
无监督反欺诈优势明显
技术手段愈加丰富,风控人员与黑产之间的博弈也愈演愈烈。面对快速迭代的欺诈模式,传统反欺诈方案的不足渐渐凸显出来,而无监督机器学习提供了一个比较好的方向。传统的风控手段更多的是被动防范,欺诈损失产生后才能亡羊补牢,而这种反应方式最快也要几个小时。如今,新的欺诈模式层出不穷,在标签数据严重缺乏的情况下,无监督机器学习(UML)成为近年来反欺诈的新宠。
无监督机器学习成为反欺诈新宠
传统无监督机器学习是一种在无标签的数据中提取其中隐藏信息(数据结构和模式)的算法,主要应用于数据挖掘、模式识别,优点是不需要标签。但传统无监督机器学习在应用上同样面临结果难以评估、时间复杂度高等难题,无法很好地满足客户需求。
DataVisor维择科技研发了一套专门应对团伙欺诈的无监督算法,目前已经应用到社交平台的批量注册、电商平台的薅羊毛、APP的虚假注册、金融领域的可疑交易、保险领域的虚假理赔等多样场景。
DataVisor维择科技的无监督机器学习算法在高维特征空间中对用户进行聚类,通过整体分析用户行为,能从不同维度聚类出相似的用户,以此检测出可疑的用户行为。无监督机器学习算法有三个明显优势:一是自动挖掘和检测各种已知、未知的欺诈行为;二是自动产生标签,用于机器训练检测模型;三是自动产生规则,免除费时的人工规则调试。
最后是网友提问环节:
1.无监督算法怎样与规则、黑白名单技术进行配合?
崔宏宇:传统的规则、黑白名单、有监督模型在风控过程中也能起到一定效果,而无监督算法能够从不同角度覆盖更多新型欺诈风险。对于一个比较完善的风控体系来说,规则、黑白名单、有监督、无监督都是必不可少的,多种技术之间可以相互融合。
2.一般企业的业务数据都涉及隐私,DataVisor维择科技是以产品方式还是项目方式为客户服务的?
崔宏宇:现在是两种方式都有,一些敏感行业比如金融行业对数据隐私的要求是非常严格的,这种情况下我们需要去客户的环境进行建模服务。在以产品方式为客户服务时,我们会把无监督建模平台、变量计算平台、规则引擎等一系列产品提供给客户,由客户自己使用。还有一些客户的数据经过脱敏后可以进行云上的分析和处理。
3.每一个具体的欺诈场景是不是都要选择一套合适的算法?
崔宏宇:理想状态下,每一个具体的欺诈场景最好都有一个单独的模型,因为这样模型会专注于这个场景,但是不一定每个场景都需要不同的算法。无监督适用很多场景,例如批量注册、垃圾信息、广告行为这种团伙欺诈行为利用无监督都可以解决。
嘉宾简介:
崔宏宇
DataVisor 中国区技术负责人
现任DataVisor中国区技术负责人,自2015年起,在DataVisor开发使用分布式无监督机器学习算法进行反欺诈检测。负责过如Pinterest、Yelp、阿里巴巴和猎豹移动等大型互联网企业的机器注册、虚假评论、垃圾邮件、欺诈交易和虚假应用安装等场景的反欺诈建模 。在模型调优、特征工程和算法开发等领域都有着丰富的经验。
关键词:深度,剖析,企业,难点,博士,科技,做客