金融机构攻坚大模型落地:阿里云张翅拆解四大工程与智能体破局之道

张翅 2025-04-18 10:11:15

随着大模型技术的逐渐成熟,国内金融行业已形成“加速AI创新”的共识,并开始深入探索如何利用大模型完成更复杂、更核心的任务。近日,dbaplus社群在2025阿里云AI势能大会-金融创新峰会上专访了阿里云智能集团副总裁、新金融行业总经理张翅,结合当前金融机构拥抱大模型的普遍性挑战及阿里云的新解法,探讨如何选择更适用于国内金融机构落地大模型的方式和路径


张翅

 

阿里云智能集团副总裁

新金融行业总经理

 
 
Q1
 

如今金融机构对落地大模型的态度有何变化?面临哪些关键挑战?

 

张翅:此前,金融机构对于落地大模型更多是持谨慎观望态度,主要受技术、业务、监管及安全等因素制约,仅有少数头部机构尝试AI创新。然而随着众多优秀大模型的推出和国家政策支持,行业认知发生显著转变——从观望迅速转向积极拥抱,这一变化远超预期。

 

在加速布局的同时,金融机构仍需应对四大核心挑战:

  • 应用工程:动态适配能力成为场景落地瓶颈。传统固定流程难以满足实时业务需求,需通过多智能体协同架构动态拆解任务,实现从“预设流程”到“灵活响应”的升级。

  • 模型工程:性能与可控性的平衡难题。现有模型在整合金融领域多元知识时,面临算力消耗高与幻觉风险的双重压力,需构建更轻量、可解释的架构设计。

  • 知识工程:数据融合与质量管控的“最后一公里”。金融决策依赖外部市场数据、行内业务数据及音视频等非结构化数据的深度融合,但数据噪声和“垃圾进垃圾出”问题仍制约效果提升。

  • 算力工程:从“能用”到“高效用”的跨越。金融头部机构需千卡集群支持万亿参数模型的高并发推理,而中小机构受限于算力碎片化,亟需软硬一体化的成本优化方案。

 

面对这样的变化和挑战,阿里云的思考和行动方向是提供一个“AI平权”方案,以便各类金融机构都能找到相对清晰确定的大模型落地路线,快速响应AI热潮。无论是银行、证券、保险等规模大小的机构,都能在应用、模型、数据、算力工程等方面实现较好的结合,降低投入成本和时间周期,无需过多人才准备。同时,阿里云也在不断推动自身产品迭代,以便更好地满足市场需求。

 

Q2
 

金融机构如何利用Agent实现个性化服务?如何避免“技术空转”?

 

张翅:这里存在一个常见的误解,很多人会把Agent简单理解为流程编排工具或Prompt Engineering的堆砌。这种模式下产出的解决方案往往面临两大困境:一是使用复杂度呈指数级上升,二是容易造成技术空转,无法真正释放AI价值。

 

Agent的本质应是模型能力,而非工程组装。我们认为真正的Agent能力必须通过强化学习,内化为模型本身的泛化能力,而非依赖外部平台拼接。要把这些能力变成模型的内在能力,可以采取“先分散后集中”策略,先训练细分场景的小模型(如信贷审批模块、合规检查模块),再通过知识融合构建通用大模型。

 

比如金融领域的审计报告、财务报告、投研报告等,都是将行业知识(如审计规则、信贷准入标准、理财建议逻辑等)通过训练让大模型得以掌握。同样,不同岗位的专业知识都可以通过这种方式让模型学习,这种将行业Know-How深度编码进模型的方式,才是实现“基础模型-岗位能力-业务价值”正循环的关键。

 

Q3
 

面对MOE和MOA两种架构,金融机构应该如何选择?

 

名词解释:

  • MOE:Mixture of Experts,混合专家模型,是一种机器学习模型架构,核心思想是通过组合多个“专家”(子模型)来处理不同输入,由门控网络(Gating Network)动态分配任务,提升模型的灵活性和效率。

  • MOA:Mixture of Agents,智能体混合,是当前人工智能领域的一项前沿技术,它通过整合多个大语言模型的智慧,像‘团队协作’一样共同解决问题。简单来说,MOA让不同AI模型各自生成答案,再通过投票、辩论或综合评分等方式选出最优结果,或融合成更全面的解决方案。这种技术能显著提升AI的准确性、减少错误,尤其在复杂任务(如医疗咨询、代码生成)中表现突出。

 

张翅:互联网公司适用MOE架构是毫无疑问的,但金融机构由于业务流程的复杂性和多变性,更适合使用MOA架构,这里的A指的是小模型。我们认为,针对金融行业细分岗位,采用“一个基础大模型与多个不同岗位的蒸馏小模型结合”的方式更匹配金融机构的实际情况,可以类比为“通识教育+专业教育”模式,即:

  • 基础大模型提供通用智能(相当于通识教育);

  • 各领域小模型提供专业能力(如审计、风控等专业领域)。

 

目前不少头部机构已经意识到,小尺寸模型可以用很少的算力,基于自身业务数据快速实现专业价值。不像以前需要把数据送到大模型重新训练——就像一个人同时学100门课很难,但专精一门课就容易得多。且很多大行已经意识到,自己投入做基础大模型很难竞争过专业模型公司。它们现在的策略是:基础模型选择开源方案(如Qwen等),然后自己做强化学习和蒸馏,将专有数据与开源模型结合,训练出专属垂类模型。

 

这就是MOA架构的优势所在,当基础模型迭代更新时,只需对小模型重新做两周左右的蒸馏即可,不需要花费数月重新训练,这也便于灵活切换不同的开源模型,所需算力少、时间短。

 

Q4
 

阿里云在大模型幻觉这个问题上有什么解法?

 

张翅:阿里云采用“三层防御体系”应对大模型幻觉问题,在保证生成结果准确性的同时实现业务闭环:
 

  • 基础层:动态增强的RAG架构

    RAG(检索增强生成)仍然是基础方法,不能完全抛弃。但对于复杂任务,仅靠RAG是不够的,因为它难以理解深层意图和执行多步操作,比如生成审计报告涉及很多步骤,仅靠RAG无法保证准确性和一致性。

 

  • 核心层:MOA架构下的专业校验模型

    我们的方法是在"大模型+小模型"(MOA)架构中部署专业校验模块,形成双保险机制。比如针对审计场景,可以训练一个专门负责核对的小模型,把数据勾稽、文字一致性、计算验证等检查能力训练到模型中。

 

  • 进化层:数据双飞轮驱动持续优化

    阿里云最新发布了“数据双飞轮”,是面向未来企业内部无限靠近AGI大模型+非常多小模型的架构,基于可观测与可评测的智能体平台,能帮助企业实现内部“快思考”与“慢思考”的高效协同。

 

具体实现步骤:

  1. 选择具体业务场景,构建简单的Agent框架,不追求过于复杂的智能体;

  2. 将业务规则和知识训练到模型中,而非硬编码;

  3. 通过“人工复核→模型微调→自动部署”三阶段实现能力跃迁。

 

这就像人类工作经验积累的过程,但模型学习速度更快,通过足够多的优质样本和反馈循环,模型就可以快速达到专业水平。

 

Q5
 

国内金融行业监管严格,且算力需求日益复杂,金融机构如何做到大模型训练的高性能与合规性的平衡?

 

张翅:性能与合规不是零和博弈,我们的建议是通过技术架构与合规体系的深度耦合解决这一难题:

 

1、软硬协同设计,一体化考虑,不分开建设。

 

2、根据场景需求选择合适的技术路线:

  • 简单问答场景;

  • API调用场景;

  • 复杂任务场景。

 

3、安全架构分层设计:

  • 基础API网关处理基础安全;

  • 复杂任务增加对抗检测层。

 

4、分阶段实施路线图:

  • 初级入门方案;

  • 中等复杂度方案;

  • 高级业务深度整合方案。

 

关键是不能静态比较硬件参数,而是要结合软件能力和业务需求整体评估,比如做复杂任务就需要在MOA架构中加入校验小模型,这与简单API调用的安全要求完全不同。

 

Q6
 

多数金融机构的技术改造都是先从边缘系统开始,再逐步涉及到核心系统,目前对于大模型的落地应用也是如此吗?

 

张翅:这是个好问题,但答案可能与常规思路不同。金融机构以往的传统做法是从边缘系统开始,核心系统维稳不动,但在大模型的热潮下思路发生了变化——优先选择最能创造业务价值的场景入手,不管是边缘还是核心

 

比如:

  • 如果重视经营管理,就从内部经营分析切入;

  • 区域性银行可能最关心信贷场景,优化本地企业风险评估;

  • 有些机构则会先使用大模型梳理混乱的内部数据。

 

关键是大模型能直接解决业务痛点,比如我所了解的某大型银行,发现用大模型生成的供应链金融报告的质量,超过了他们Top 3员工的水平。这种实实在在的价值让金融机构不再纠结边缘还是核心,而是直接选择高价值的场景。

 

Q7
 

大模型时代的金融机构将面对怎样的未来?阿里云下一步的重点会放在哪里?

 

张翅:我们认为,未来的竞争不再是抢占入口,而是比拼智能服务质量。大模型正在推动金融行业进入“智能服务能力”的终极竞争阶段。我们认为,未来金融业的竞争将围绕三大核心能力展开:认知决策能力、场景融合能力和持续进化能力。

 

阿里云的战略布局聚焦“三位一体”技术架构,助力金融机构构建下一代智能服务体系:

  • 坚持“全尺寸”模型策略:从基础模型到推理模型到融合模型布局完整技术栈。针对不同行业对模型的需求差异,我们会针对金融行业的特点发展专属模型。

  • 深化Agent能力:目前阿里巴巴内部各业务都在Agent化和AI化,我们会把这些经验输出给金融机构。

  • 生态融合创新:未来可能不再是APP时代,而是智能体时代。比如养老金融服务可以嵌入高德地图的打车优惠、旅行规划可以结合飞猪的酒店服务等,这种跨业务场景的智能融合会创造新价值。

 

未来的赢家,将是那些率先将“模型精度、场景理解、生态协同”转化为智能服务能力的机构。阿里云将持续开放全栈能力,做金融业智能化转型的“技术合伙人”。

 

更多金融大模型解惑
 

 

2025年5月16日,阿里云智能集团代表将出席XCOPS智能运维管理人年会-广州站,带来金融大模型主题演讲,针对如何推动金融机构更大范围的数据与大模型全面融合、如何将AI能力与金融业务紧密结合等热点问题展开更详实的解答,扫描下图二维码就可报名参与:
 
最新评论
访客 2024年04月08日

如果字段的最大可能长度超过255字节,那么长度值可能…

访客 2024年03月04日

只能说作者太用心了,优秀

访客 2024年02月23日

感谢详解

访客 2024年02月20日

一般干个7-8年(即30岁左右),能做到年入40w-50w;有…

访客 2023年08月20日

230721

活动预告