FinEval作为国内首个聚焦金融领域的综合性测评基准,覆盖财富管理、保险、投资研究等多个财经场景以及财经专业主题学科,总评测题数目超过13000道,月均访问量1000余次,月均clone使用量20次,拓展题库超过5000道,发布团体标准、安全白皮书等,实现重大创新突破,引领财经行业大模型落地应用发展。Fin-R1作为全国首个财经R1类推理大模型,凭借7B参数的轻量化设计与两阶段混合训练(SFT+RL),在权威评测中以75.2分位列第二,支持贷款计算、资产配置等复杂任务,其开源特性显著降低中小机构技术门槛,助力金融智能化普惠发展。
实验室同步深化多领域合作:与东方证券股份有限公司、金仕达软件科技股份有限公司等机构围绕“审计模型构建与合作赋能”展开深度交流,共同探索人工智能在智能审计与风险管理中的应用,推动技术成果向业务场景转化。
此外,实验室联合国泰海通证券股份有限公司,基于大语言模型(LLM)与智能体(Agent)框架,落地两项前沿金融科技方案:
(1) LLM驱动的智能数据分析助手:通过Agent框架构建对话式分析系统,用户以自然语言指令(如“对比京沪分公司Q3绩效”)触发自动化流程,实现跨系统数据溯源与动态图表生成,支持多轮交互式探索。
(2) 智能体协同的融资融券交易引擎:LLM解析用户交易场景描述(如“两融账户持有宁德时代20万股,最大可开仓多少?”),由交易Agent实时计算担保品折算率等核心指标,攻克传统模型无法处理的两融专业计算难题。
供稿 | 杨凯、张立文
供图、编辑 | 杜雨晴
审核 | 周亚虹


