“我们既不盲目争先,也不甘落后,即便在资源上存在差距,也不放弃深入研究与部署,积极拥抱大模型带来的变革。在场景选择上,我们择优而用,不刻意偏袒某一特定大模型作为应用基础,而是更加注重依据业务场景需求来确定实现方式。”1月11日,在新金融联盟举办的“AI提升金融服务效能的场景创新与趋势展望”内部研讨会上,上海银行副行长、首席信息官胡德斌在主题发言中表示。
会上,工商银行首席技术官吕仲涛,兴业银行首席信息官、科技管理部总经理唐家才,民生银行数据管理部总经理沈志勇,百融云创董事长张韶峰也做了主题发言。国家金融监督管理总局相关负责人参加了交流。
会议由新金融联盟秘书长吴雨珊主持,中国金融四十人论坛提供学术支持。来自商业银行、金融科技公司的170余位代表通过线上线下参会。会议实录详见→《智能体爆发元年,中小银行如何逆流而上》,以下为胡德斌发言全文。
中小银行大模型场景应用
选择考量及挑战
文| 胡德斌
上海银行副行长、首席信息官 胡德斌
非常高兴能与大家一同交流、分享上海银行在大模型领域的应用实践及个人的思考见解。
一、大模型技术带来的影响观察
大模型技术对银行业的影响可划分为短期与长期两个维度。
从短期视角来看,大模型能够显著提升工作效率,文档助手、编码助手等工具便是例证。此外,借助大模型的普适性,可将原本仅面向高净值客户的专家服务下沉拓展。通过融合大模型的通识能力与银行专业知识、客服专家经验以及客户画像数据进行训练,便能打造出数字客服专家,突破专家数量与服务精力的限制,为更广泛的客户群体提供更具针对性的服务。我们也要看到,大模型在推动银行业务发展、产品创新的同时,也带来了诸如数据泄露风险、大模型稳定性风险、可解释性风险等新挑战,这些风险均需深入研究与妥善管理。
从长期角度而言,大模型将深刻改变银行业的竞争格局、经营模式与服务模式。例如在市场研究领域,大模型为中小银行提供了全新的思路与方法,对银行发展战略的制定大有裨益。风险管理层面,大模型助力银行实现智能化、精细化与前瞻性的管控,从而有效提升风险管理能力,降低潜在风险损失。产品服务模式也将由单一向多元、由被动向主动转变。
大模型在银行的建设和应用路径大致可归纳为以下几类:一是嵌入式大模型的调用,无需关注基础模型的选择,仅以实现特定应用目标为导向,构建类似黑盒应用体或智能体来满足特定需求;二是将调用大模型的API与业务流程应用相结合的模式;三是目前应用较为广泛的Agent模式;四是利用私有数据进行微调和训练模型,进而形成企业专属模型。这些应用模式的成本呈递进式增长,但模型的针对性越强,产生的效用就越大。不同规模的银行需根据自身所处阶段,选择符合自身特点的应用路径。
通过对公开资料的搜索以及与同业的交流,我们概括了不同类型银行大模型基础能力状况。
不同的资源属性导致银行在使用大模型的方式和方法上采取不同策略。我行的策略是密切关注行业应用趋势,分析同业布局,应用路径上秉持借智借力的原则,借助厂商和大行的技术能力与经验。我们既不盲目争先,也不甘落后,即便在资源上存在差距,也不放弃深入研究与部署,积极拥抱大模型带来的变革。在场景选择上,我们择优而用,不刻意偏袒某一特定大模型作为应用基础,而是更加注重依据业务场景需求来确定实现方式。
二、上海银行大模型建设及应用实践
总体而言,我行的大模型建设和应用规划的近期目标是以智能体开发平台为载体,系统地构建各类数字员工或智能体,形成人机协同的新生产模式。秉持“以用带建”“以建带培”的策略,从基础能力建设、场景应用、人员培养、模型优化等多个维度着手,营造一个让每位员工都拥有“AI助理”的环境与创新氛围。
具体而言,从两个层面推进。一是从上至下的总体谋划,精准定位合适场景,采用统一规划、统一实施的方式构建主要应用。二是搭建大模型应用开发平台,鼓励员工结合实际业务需求开发“AI助理”,激发自下而上的创新活力。
在此过程中,有三个方面尤为关键。
第一,模型的统一管理。无论是生成式AI大模型,还是以规则判断为主的小模型,应用范围都日益扩大。如何妥善管理、监测模型,并确保其能够及时升级迭代,已成为日常运营管理的新领域与新挑战。自去年下半年起,我行便着手构建全行企业级的统一模型管理平台。
第二,统一知识管理。随着内外部数据的持续增长,从海量数据中筛选出有价值的知识愈发困难。同时,不同系统间数据存储格式的差异导致数据连贯性欠佳,使得统一管理复杂度倍增。因此,建立统一知识管理体系和数据空间势在必行,需推动数据落标、跨领域数据整合,保障数据持续更新,同时严格管理数据安全。
第三,数字化人才培养。不仅科技人员要积极学习和运用大模型,业务人员也需转变思维、掌握相关技能。通过培训、研究、实践来促进全体员工思维转变与技能提升。
接下来,我介绍一下上海银行在大模型应用领域的两个案例。
我行即将推出AI手机银行,积极探索从传统的GUI(图形用户界面)模式向LUI(语言用户界面)模式转变。客户可通过语音对话方式提出服务或咨询需求,手机银行进行语义理解与功能调度,在关键交易环节再呈现交易画面供客户确认,以更自然、友好的方式为客户提供银行服务。
在智能问数领域,我行也进行了诸多有益尝试。最初的报表开发采用需求定制模式,根据业务部门的需求来绘制表样、编写程序。随后发展到通用报表模式,通过“拖拉拽”的方式快速组装报表。如今,借助大模型理解用户的用数需求,自动转化为SQL语句搜索数据,并以可视化形式反馈结果。这不仅是开发模式的革新,更是让数据消费变得便捷,持续激发各层级员工利用数据分析发现问题、把握趋势、强化管理,实现“看得清、看得全、看得透,管得好”的目标。
三、大模型应用面临的问题与挑战
大模型在带来诸多机遇的同时,也伴随着一系列挑战,主要体现在企业宏观层面与实施落地层面。
在企业宏观层面:一是缺乏高质量金融训练数据。银行业务涉及大量复杂且专业的金融数据,这些数据通常是结构化与非结构化数据的混合体,同时还面临着隐私保护与合规性问题。获取足够多、质量好且覆盖广泛场景的金融训练数据是一项艰巨任务。
二是算法可信性与安全性有待提升。银行对准确性、合规性的要求极高。目前大模型可能存在可解释性差、易受攻击等问题,需进一步深入研究与改进,以满足金融行业的严格标准。
三是训练及推理算力投入成本高。大模型的训练与推理往往需要海量的计算资源,这涉及到昂贵的硬件投资以及持续的能源消耗,对于中小银行而言,无疑是一笔沉重的成本负担。
四是大模型应用支撑队伍尚未成型。有效开发、部署与维护大模型需要一支涵盖数据科学家、算法工程师、系统架构师等多学科背景的专业人才队伍,但目前这类复合型人才稀缺,银行需投入更多资源来培养或招聘适应大模型应用需求的团队。
从实施落地层面来看,同样面临四个方面的挑战:
一是平台基础支撑能力。需要构建一个全行性的、技术与业务均可便捷使用的大模型应用开发平台,便于快速搭建大模型应用与数字员工,同时也能有效整合不同类型的硬件资源,实现算力的统一管理和调度,从而提高算力资源的利用效率。
二是跨组织、跨团队协同。鉴于大模型技术的复杂性,跨团队协作需要具备高度的技术理解和沟通能力。因此,跨组织、跨团队的协同成为商业银行落地大模型的一大难题。此外,大模型应用要求组织架构更加扁平化,部门间的壁垒需进一步弱化,扭转员工的固有意识也并非易事。
三是关键知识的模型注入。大模型的知识注入过程需将银行的专业知识与通用模型有机结合,以确保模型能够精准适应特定的业务场景。然而,收集和整理交易数据、产品数据、风控数据等需耗费大量时间和精力。而且,部分业务知识可能涉及敏感信息,如客户隐私、银行内部风险控制策略等,在注入大模型时必须确保数据安全与合规。
四是运营保障能力。大模型的可解释性与信任度是运营过程中的关键问题。若模型决策过程不够透明,可能会引发用户对模型结果的信任危机。因此,保障大模型的稳定运行与持续优化是重要挑战。
最后,我提出一个建议:整合资源,共同打造安全可信的AI应用生态。其主要原因是大模型输出的操作性更强。
当大行向小行输出业务应用系统时,落地过程的复杂性是一个必须正视的难题,通常需要进行大量的本地化改造与外围系统对接,大行往往需派遣数十名人员到现场实施,且持续时间较长,可称之为“硬着陆”。而大模型作为知识与能力的载体,易于实现资源共享与复用。小行在引入大模型后,可根据自身具体业务需求,通过微调等手段,迅速将其应用于信贷评估、风险预测、客户服务等多个领域,无需像应用系统那样开展大量定制化开发,可称之为“软着陆”。
要实现共建共享的目标,离不开监管部门的指导以及行业协会的组织协调,促使各方协同合作。其中,大型金融机构等重要参与方应充分发挥自身在算力、数据资产、人才等方面的优势,与中小银行机构共同构建行业大模型。
在合作过程中,需解决一些关键问题:明确大行与小行分别承担的角色与定位。无论是大行还是小行,不仅要着力构建已有模型应用,还应考虑成果输出后能够获得相应的收益。否则,若银行做出了贡献却无收益,可能会引发国有资产流失的担忧。要实现算力共享,将每家银行的硬件资源汇聚起来,能够有效提高资源利用率。同样,如何衡量这些硬件资源的投入产出,也需要深入研究与讨论。
随着大模型的出现,具备数据、算力、技术人才优势的大型机构可能会形成更大的头部化效应,进而导致竞争格局发生更为复杂的新变化。大模型不仅为银行业带来了效率的提升与变革,也使得竞争格局和风险特征变得更加复杂。希望我们能够群策群力,共同探索,让大模型为不同规模的银行注入新的发展动力,成为推动高质量发展的基础与源泉。
本文首发于微信公众号:新金融联盟NFA。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。