近日,以“智联世界,生成未来”为主题的2023年世界人工智能大会(WAIC)在上海圆满落幕。本次大会旨在搭建世界级合作交流平台,共促发展新机遇。全球知名商业领军者和全球创新先锋云集于本次大会,阐述其对于新AI与新商业的见解,其中,加拿大工程院和加拿大皇家学院两院院士、FATE开源社区技术指导委员会主席、微众银行首席人工智能官杨强受邀出席,分享了联邦学习领域的前沿研学成果。
可信联邦学习与联邦大模型,解构大模型时代数据之困
7月7日,在由世界人工智能大会组委会办公室主办,中国信息通信研究院承办,中国信息通信研究院华东分院、中国信息通信研究院云计算与大数据研究所协办的“聚焦·大模型时代AIGC新浪潮”论坛上,杨强发表了“可信联邦学习与联邦大模型”主题演讲。
杨强发表“可信联邦学习与联邦大模型”主题演讲
在大模型迅猛发展的当下,对算力、数据量的极高要求是横亘在中小型机构AI应用之路上的一道难以跨越的鸿沟。正如OpenAI CEO Sam Altman所言,未来模型参数应该向更小的方向发展,或者以多个小模型协作的方式工作。
杨强指出,联邦学习(Federated Learning)能够联合分散的数据、分散的算力,可应用于解决可用数据量不足的问题,从而使多方共建大模型基础设施,为业界提供了前瞻性的解决方案。当前,FATE(Federated AI Technology Enabler)开源社区已经发布了开源的联邦大模型功能模块FATE-LLM,支持各参与方的敏感数据不出本地域的前提下,根据各方实际数据量进行算力投入,联合进行大模型训练。未来,联邦大模型架构将重点发展同构与异构联邦大模型、大模型指导小模型联邦等方面,进一步提升联邦大模型的可用性、易用性。
在联邦学习整体研究与产业落地方面,杨强介绍,“可信联邦学习”(Trustworthy Federated Learning)作为安全可信的多方分布式机器学习范式,具有安全可信、高效可用、可管理、可审计、普惠等核心特征,将更加适配当前产业发展所需综合考虑数据安全、隐私保护与效率的要求。同时,杨强介绍了可信联邦学习最新的前沿研究与应用成果,包括质效均衡的可信联邦学习算法框架,在金融反洗钱等行业场景中的应用等。
携手共建联邦学习开源生态,推动数据要素安全流通
7月8日,在由世界人工智能大会组委会办公室主办,机器之心承办的“AI开发者”论坛上,杨强重点作“可信联邦学习与开源生态”主题分享,重点介绍了隐私计算和联邦学习开源社区与生态。
杨强发表“可信联邦学习与开源生态”主题演讲
据杨强介绍,开源已成为隐私计算技术规模化的其中一个重要途径。FATE开源社区是由联邦学习技术开发者、行研方、产业方及生态伙伴共同组建与治理的协作创新平台,相关参与方可以基于工业级联邦学习开源框架FATE探索联邦学习技术的研究与应用。FATE开源社区以“开源开放,共力创新”为愿景,汇聚了4000+社区用户参与社区共建,覆盖金融、医疗、科研、人工智能等多个领域与场景,不仅已成为全球领先的联邦学习开源社区,还是可信数据流通领域最具影响力的社区之一。
在建立行业标准、推动应用场景方面,FATE开源社区的成员单位共同牵头建立了多项联邦学习技术标准,落地了在企业跨主体的大数据协作、企业异构平台互联互通、多中心医疗发现等多场景下的联邦学习应用实践,共同打造了包含数据提供方、模型提供方、业务提供方、价值中介方等各环节紧密结合的数据要素流通生态。
谈及未来发展趋势,杨强认为联邦学习与开源生态将成为隐私计算、机器学习和数据科学发展的关键驱动力。其中,可探索的重点包括进一步完善联邦学习安全机制;推动跨平台的互联互通;推动数据确权与定价和模型交易;基于“模型和数据集水印”技术的模型审计和模型全生命周期管理;推动联邦学习与大模型、区块链等技术的融合等方面,为未来的智能时代提供核心支持。
关键词: