英特尔SGX为联邦学习保驾护航
时间:2022-03-14 18:12:02 | 来源:行业动态
时间:2022-03-14 18:12:02 来源:行业动态
不管是AI安全还是数据安全,安全保护都是整个逻辑中非常重要的一环。在联邦学习和训练的过程中,就需要传输交换参数,传统方法是使用加密算法中进行非正常加密,从而保证数据传输过程中不被外部进行恶意攻击。
通过硬件增强型安全技术的支持,在特定硬件中建立一个可信执行环境(Trusted Execution Environment,TEE),使外界无法触达和攻击敏感的数据和应用,是应对这一问题的更为有效的手段。
王健宗博士表示,平安科技联邦学习团队基于这一理念打造并构建了全新的蜂巢联邦学习平台,为用户提供数据隐私安全保护的一站式解决方案。在该平台的构建过程中,如何进一步增强多源数据在其本地的安全性,如何为AI模型调优的中间过程提供更可信的安全保障,以及如何有效地评估各数据源对于最终优化结果的贡献度,都是非常重要的隐私。为此,联邦学习团队与英特尔一起,通过引入英特尔SGX技术,为以上问题提供了更优的解决方案,这也是现在蜂巢联邦学习平台的优势之一。联邦智能意味着什么?就是安全可信的智能,这是未来的趋势。
在特定硬件的环境进行计算,不管在算法层面或者硬件层面,平安科技的联邦学习方案借助英特尔SGX技术做到了双重加密的机制,保护代码和数据机密性和完整性,有效阻断外部恶意攻击。还有通过内存加密技术,保护程序状态的安全,从根本上杜绝了数据隐私泄露的问题。 英特尔致力于打造可信计算数据分析的可信环境,而SGX技术可以实现可信执行环境,正好符合目前联邦学习的运算需求。王健宗说。
联邦学习更多是为了解决在数据不共享、隐私保护的前提下实现共同建模、共同分析的一个技术,如果没有英特尔SGX技术的话,而是通过传统的软加密方式,比如在传统的深度学习框架TensorFlow、PyTortch、Caffe、MxNet等上面改造,这样带来的一个问题是导致在信息处理传输中因为加解密会消耗太多的时间。如果有SGX技术构建的硬件可信平台,就可以把接口封装好,在信息传递加解密过程当中更快更高效,加快迭代训练。
在平安科技的联邦学习方案中,通过处理器指令,英特尔SGX技术可在联邦学习的各节点中,创建更有助于确保数据安全的内存飞地,用于中间参数的交互和传输,以杜绝内外部攻击,为多源数据环境下的联邦学习实践探索提供更为可靠的安全保障。在这一过程中,英特尔架构处理器为飞地的构建、加密通道的敷设以及中间参数的交互和聚合提供强大的算力支持。
王健宗博士表示,联邦学习对于硬件的要求是数据在传输过程当中能够实现实时的加解密,在分布式环境下实现高效联合建模,这有赖于计算、存储、网络等。比如在网络层,5G给联邦学习提供了很好的机会。而在存储层,因为涉及到大量的小数据读写,海量IO并发,这也要求存储架构足够强壮。英特尔傲腾数据中心级持久内存,性能优化的英特尔傲腾固态盘,与基于QLC技术、成本优化的英特尔3D NAND固态盘有机结合,能降低从系统存储获取数据的高延迟,促进数据流动,提升数据的可处理性。
结合英特尔SGX技术的1+N联邦学习解决方案,可以更精确地评估各节点数据对于AI模型训练的贡献度,方便用户对方案进行调整。在1+N式方案中,当有N个数据源时,可以先对所有节点进行训练,得到全量的训练效果。而后再分别对除了待评估节点以外的N-1个节点进行训练(例如评估节点#1时,对节点#2至#N进行训练),在得到不同训练效果的模型后,系统可以计算出每个数据节点在联邦学习中的贡献系数,从而对各个数据节点在AI联合训练中的贡献度做出更为精确的评估,并据此进行方案调整。
王健宗薄设计说,以上算法和调度,可能会对联邦学习的性能有所影响,是否奏效还需要用实践来予以验证。但如何进一步利用英特尔技术所构建的飞地,确实还有很大的空间等待探索和发掘。双方共建联邦生态,未来的合作空间非常大。我们本着开源的精神希望未来通过构建联邦智能,和以联邦学习为基础技术的深入探索,进行落地应用研究。相信构建联邦智能的生态是肯定可以实现的。
目前,平安科技联邦学习团队正在利用联邦学习方法,重点研发设计面向数据强监管的金融业多态多任务学习模型,满足银行和金融机构在风险评估、反洗钱、投顾、投研、信贷、保险和监管等众多应用场景中的需求,帮助用户利用AI能力构建更有效的风控和营销模型,有效识别信用卡盗刷、贷款逾期、金融欺诈等潜在金融风险,有效减少金融企业的经营风险。同时,联邦学习方法也能帮助用户利用横向数据实施用户画像,拓展销售通道,优化营销策略,为企业销售能力的提升提供一个强有力的智能化引擎。
联邦学习的时代已经到来。在未来,联邦学习团队还将与英特尔进一步开展技术合作,以更多、更先进的技术驱动数据资源在联邦学习中的安全运转和高效转化,并与更多企业和机构相互协作,打破数据壁垒,推动联邦学习在各行各业中的快速发展和应用。我们相信联邦学习将重塑今天人工智能领域乃至整个计算机领域的生态。王健宗博士总结道。