金融推理大模型价值初探:能否成为行业智能体下一“风向标”?

资讯 » 科技头条 2025-07-29

2025世界人工智能大会上,大模型、智能体毫无疑问是最热话题。当大模型和智能体走向规模化应用,如何将它们的巨大潜能,真正转化为驱动产业升级的、可信的生产力?答案或在于,更垂直、更专业的方向转变。

7月28日,在"智能体驱动产业变革"论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,为金融AI应用打造"可靠、可控、可优化"的智能中枢。这是国内首个专注金融推理的商业化大模型。在蚂蚁数科看来,金融推理大模型是金融AI智能体发展的关键一步,它将推动金融行业向更智能、高效的方向发展。


让智能体更"懂行"

"当以大模型和智能体为代表的AI浪潮来临,其将深刻改写产业运行的逻辑,而数字化程度最高、数据密度最大、AI应用场景最丰富的金融业,无疑是AI率先落地的绝佳行业。"蚂蚁数科CEO赵闻飙如是说道。

首先需要明确的是,何为AI智能体?甲子光年创始人张一甲解释道,其本质就是把模型的"超级大脑"和自动化的"敏捷双手"结合在一起,大脑思考,双手调用工具、执行任务。业内一致认为,智能体将驱动产业颠覆性的变革,尤其在科技创新与产业创新深度融合的战略框架下,智能体是金融业数字化转型的关键推手。

作为将大模型"大脑"的认知能力转化为具体金融业务执行力的"行动者",智能体的应用也需要更"专"。赵闻飙指出,AI智能体产业价值的释放,关键在于"水平通用"向"垂直专用"的战略转变。智能体的价值不在于解决1000个浅层问题,而在于攻克行业的深层痛点,智能体要围绕场景出发,要深入企业的业务场景,将专业领域知识的价值最大化,才是产业落地的关键。

也正因‌大模型是智能体的核心智能引擎,只有深度理解行业的大模型,才能让智能体真正"懂行",贴近一线,创造真实的业务价值。然而,大模型在金融领域的应用持续深化,在实际业务场景中,往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融级安全合规等要求,现有的大模型在解决实际金融任务时仍然存在诸多挑战。

更先进的金融推理大模型呼之欲出。"一个好的垂直大模型,特别是推理能力很强的大模型,才能成为一个智能体可控、可靠、可优化的智能中枢,没有这个东西就像机械设备没有关键的齿轮。"蚂蚁数科CTO王维强调,推理大模型产生的推演能力、泛化能力、意图识别能力、结构化表达能力,是企业愿意用新技术取代原有业务模式、创造增量价值的基础。

蚂蚁数科AI技术负责人章鹏也表示,推理大模型能解决通用大模型在金融领域的局限性。在与客户(采购大模型产品的金融机构/企业)的接触实践中发现,客户需要知道模型的思考过程,需要可解释的结果,而推理模型恰好能满足这一点。

三个"E"的经验

对于金融推理大模型的特点,王维将其总结为三个"E":高质量数据(Excellentdata)、持续迭代(Evolving)以及兼顾数据和训练消耗的工程观以解决效率(Efficiency)问题。

什么样的数据才可被称为"高质量的"?章鹏指出,需满足多个条件。"首先要来自真实的问题,我们会对真实线上问题做一定改写;其次要保证问题的多样性,涵盖金融标签体系的不同业务和属性,并有多样的问法;再者,要对推理思维链进行精简,注入专家知识以符合金融规范,还要校验推理的正确性。"此外,这些数据需要金融专家进行标注和校验。

据悉,蚂蚁数科构建了业内最全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升模型处理复杂任务的能力,让大模型"天生懂金融,出厂即专家"。

在工程化与迭代方面,王维提到,模型需要经过充分的知识引入、微调和加训才能解决金融严肃场景的问题。从蚂蚁数科的经验来看,是"两阶段加训"的过程,第一阶段在蚂蚁内部进行大规模训练,让模型具备强大的金融基础能力;第二阶段针对具体业务场景和客户需求进行本地微调。

建立一套高频的敏捷迭代机制更为关键,能够确保持续发现模型中的问题和缺陷,快速修复以提升用户体验。在这背后,一方面需要密切关注线上数据,定位模型的实际表现;另一方面要紧密追踪金融动态、市场的调整以及产业结构和产品的变化,不断完善任务体系,识别模型可能存在的能力的盲区。

"最终,通过训练与评测一体化联动,以高效生成的训练数据,驱动模型持续进化,确保知识常新、能力在线,能够更贴合金融业务的实际需要。"王维总结道。

走向金融业务深水区

"智能体高峰将至。推理大模型能力越来越强,更多原来解决不了或者原来解决不够好的金融场景中的问题,将会被列为接下来重点推动的任务清单,这一过程将加速到来。"对于金融推理大模型的前景,王维充满信心。

市场需求验证了这一观点。王维表示,金融推理大模型的出现是必然的,因为金融复杂场景需要清晰的推理链条和逻辑。金融对错误的容忍度低,一个不能理解行业的大模型无法满足需求,不同金融机构有不同的业务禀赋和偏好,需要推理大模型去学习这些行内知识。

"金融机构的客户需要知道大模型的思考过程。因此,开发者永远要走在市场最前线。另一方面,成本和效率也是考量因素,客户很难接受满血版模型的高成本,而推理大模型能根据问题复杂程度调整,平衡成本和效果",章鹏说道。

蚂蚁数科金融AI产品总经理曹刚也提到,目前金融AI应用在通用领域较多,业务深水区渗透率低,而从通用走向业务场景深化是大方向,推理大模型会是重要推动力。

不过正如王维指出金融推理大模型需持续迭代,相关探索远未到终点。在王维看来,当前阶段,模型的更新仍是以技术驱动为主,技术需要先解决成本、效率问题,才能让需求真正被激发。当技术越过拐点,场景效果足够好时,市场因素会更主导。

展望未来,王维相信推理大模型会让智能体在更多金融场景中发挥作用,"从解决70%到80%的问题,再到有些能解决99%甚至100%,这是一个持续演进的过程"。当然不可忽视的是,要认识到技术的局限性,"大模型是Nexttoken的预测,对于决策至关重要、损失巨大的场景,不适合让模型直接决策,也要理性看待其能力边界"。

北京商报记者岳品瑜董晗萱



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。