钱斌:生成式AI或将帮助金融机构更快识别、分析和预测风险
科技
科技 > 传媒 > 正文

钱斌:生成式AI或将帮助金融机构更快识别、分析和预测风险

很高兴有机会在“新一代AI·新时代金融”论坛与业界和学界的各位同仁和专家共同交流探讨人工智能。很长一段时间以来,人工智能一直是一个热门话题,大家都在期待运用人工智能可以给整个社会发展带来一些新变化,诸如工业机器人、自动驾驶、无人机等等,都一定程度上改变了我们的生产生活方式。但去年ChatGPT的横空出世,我们忽然发现可能一个新的时代即将到来,人工智能极有可能从传统意义上的体力劳动替代向脑力劳动替代转变,它所带来的改变和冲击将是爆炸性和颠覆性的,甚至会改变人类的未来。譬如三五年后,一些岗位是否还需要存在?我们中的部分人是否还能淡定的坐在会场上?可以说ChatGPT开拓了人工智能新的能力前沿和想象空间,也因此引发全球高度关注。在此,我想就人工智能未来的变化以及应对举措,谈一些观点和想法,供大家参考。

第一个观点、人工智能发展迎来新拐点

追溯历史,运用和发展通用人工智能的想法由来已久。上世纪五十年代,提出了著名的图灵测试。大半个世纪以来,我们一直在探索。最近十年,逐步取得一些突破,譬如AlphaGo惊艳世人。然而,这些产品距离真正的通用人工智能还相差甚远,基本还停留在大算力和专用能力。但ChatGPT的出现,让我们所有人真切地感受到新赛道的颠覆性威力。

首先,算力、算法、数据的相互赋能,使人工智能出现了涌现效应。ChatGPT的成功离不开成熟的模型底座、丰富的数据供给和强大的算力支撑。在算法方面,在循环神经网络[1]、Transformer等算法思想、架构上逐步传承、积累。从公开数据来看,GPT模型参数从2018年最初的1.17亿,到GPT3已达到1,750亿,模型参数的规模化提升,使得大模型出现了历史性的重大拐点,发生了灵光一闪的涌现效应,从涌现到泛化,举一反三,融会贯通,能够回答没有经过特定训练的问题,目前还很难解释,但这就是进化。在数据方面,海量增长的数据为模型训练和应用提供了丰沃土壤。根据IDC数据统计,2022年全球数据总量为103ZB,中国占比接近1/4,预估2027年全球数据总量将达到284ZB。在算力方面,模型训练参数与算力成正比,据OpenAI测算,自2012年以来,全球头部AI模型训练算力每3-4个月翻一番。可以说在算法、算力、数据的共同加持下,目前GPT已支持文本和图像输入,在多种专业和学术考试中已经表现出与人类相当的能力,整个学界和业界都在期待大模型继续向着通用人工智能迈进。

其次,生成式AI改变了人类知识的存储、传承和使用方式。过去五千年,人类知识被储存在文字中,通过文字记录历史,探知未来,相互交流。过去三十年,互联网的诞生,改变了人类记录知识、获取知识的方式,通过互联网,加速了人类应用知识、创造知识的速度。而当下,因为生成式AI的突破式进展,人类的知识体系将被构建到大模型中,这是人类知识存储、传承和使用方式的再一次重构,其地位将不亚于文字和互联网的出现。人工智能从固定任务场景触发,逐步进化为通过自然语言接受指令、理解人类意图并不断迭代,由简单的“人力替代”向“人机协同”转变,实现人工智能从交互中学习,与人共同完成知识创造。

第三,人工智能正在由专用能力向通用能力转变。以往人工智能基本都是专业领域、边界清晰、定义明确的单一任务模型,任务稍有变化,效果会大打折扣。而以ChatGPT为代表的生成式AI具有了涌现能力、思维链推理能力、多模态理解和生成能力,实现了从文本理解到图像理解,从对话理解到全文理解,从意图理解到创意实现的根本性改变,不仅能够完成文学创作、代码生成、图片生成等多项任务,而且伴随数据和参数的规模提升,生成式AI拥有了学习和成长的基因,表现出的学习能力、理解能力已接近人类表现。去年一幅《太空歌剧院》,力压人类艺术家。可以说AI能力的突破性进展,正在创造历史,当然如果运用不当,也可能出现颠覆性的灾难,AI教父杰弗里·辛顿曾提出警告,人工智能的崛起将对人类生存构成威胁,其威力将与核武器不相上下。

第二观点、生成式AI将给金融业带来机遇和挑战

生成式AI作为走向通用人工智能的关键技术路线,正掀起产业变革浪潮。据彭博预测,未来十年,生成式AI市场规模将从2022年的400亿美元,增长至2032年的1.3万亿美元,年复合增速有望达到42%。我国高度重视新一代人工智能发展,从中央到地方,都纷纷推出政策,可以说,新一代人工智能的大幕已经开启,将影响整个社会和未来,金融领域也不例外。

一方面,生成式AI在金融行业的应用还处于探索阶段,需要在实践中寻找合适的突破口,并探索尝试新的商业模式,进行商业价值验证。

金融业具备大规模、高质量的数据资源和多维度、多元化的应用场景,是人工智能应用落地较为深入的领域之一。近些年,在智能客服、智慧营销、智能风控等领域都取得了不错成绩。但是,生成式AI是人工智能领域的一次范式转变,开辟了新的赛道,大家重新站在了赛道起点,我个人理解,新技术将有助于解决包括金融发展不平衡、不充分的结构性问题,数据要素向数据资产转化的问题、金融科技人才短缺的问题,以及客户体验、运营效率和风险防控等经营效能提升。目前,包括交行在内的部分大型金融机构已在积极布局,推动实现商业价值。

一是探索升级客户服务能力。生成式AI将变革人机交互方式,赋能差异化的产品和服务创新,促进实现从人性化、个性化到感性化的体验升级。比如,在精准营销方面,借助生成式大模型,在灌注专业领域知识后,一方面提升行业洞察能力,另一方面将更为精准地解读个体个性化需求,帮助实现从理解“客群”到理解“客户”的跨越,提升客户服务精准度和满意度。在智能客服方面,生成式人工智能在准确理解人类意图,进行流畅、自然、高质量的对话方面具有优势,甚至能够体现出一定的共情能力,结合文档理解分析和生成能力,人机交互的体验和效率将有望出现质的飞跃。

二是探索提升内部运营效率。探索将生成式AI应用于运营流程优化、运营模式创新、运营知识提供,从而实现运营效率提升、运营成本降低。比如,在软件研发方面,Gartner预测,到2027年,将有15%的新应用程序由AI自动生成,金融业可利用大模型实现代码生成、代码审查等能力,提升研发效率和质量。在智慧办公方面,可以存储复杂、专业、动态的制度规范,以在线问答的形式为员工提供高效精准的工作指引,成为提升员工能力的“智慧助手”。

三是探索精准的金融风险防控。生成式AI或将帮助金融机构更快识别、分析和预测风险。比如,在反洗钱、反欺诈方面,可探索借助大模型的泛化能力提升知识图谱构建效率,从而提高欺诈行为和洗钱活动的识别效果,及时发出预警,在减少客户损失的同时,降低银行自身法律合规风险。

当然,有机遇,也必然有挑战,生成式AI所形成的诸多挑战,需要加以关注和重点研究解决。

一是大模型对算力、算法、数据的协同提出了更高要求,对基础设施建设带来巨大冲击。万亿级别参数的人工智能大模型是大国重器,不是一般国家、一般企业可以承受的。大模型需要不断提升算力资源统筹调度能力、算法创新能力和高质量数据要素供给能力。在建设过程中,既需要产业上下游的合力、也需要建立国家、行业、企业的基础性规划,在海量数据收集、数据质量控制、算力大规模组网、算法持续突破等方面统筹推进,解决模型在规模变大过程中引发的一系列工程化问题。

二是数据少、质量差和处理能力弱,将限制了人工智能的应用场景,降低人工智能大模型的“智商”。前期,金融业虽然已经积累了大量数据和数据处理经验,但相对于大模型需要的数据量、知识密度和处理质量来说,还远远不够。目前,互联网中文数据相比英文数据还非常少、开源语料库有限、数据质量参差不齐,细分到金融领域,专业数据和公共数据更加不足,并且由于金融制度的差异,无法完全照搬国外的金融语料、金融知识。而金融服务的专业性、精准性又对人工智能技术的效果和可信度提出了非常高的要求。因此,在丰富数据种类、强化数据治理、提升数据质量、保障数据安全、完善数据共享机制等方面我们还任重道远。

三是数字时代是生态体系间的竞争,建立适合大模型的商业生态是当下大模型发展的重要挑战。Win-tel生态体系主导了PC时代,ARM-Android主导了移动互联网时代,人工智能时代同样将面临新的生态体系,以及不同生态间的竞争。在技术生态上,目前尚没有成熟的软硬件技术路线,国产化芯片体系建设仍是发展关键,通过加大国产化产业扶持和培养力度,将有力提高我国在大模型领域的自主可控能力。其次应用生态、场景生态决定了人工智能走多远、走多好,寻找合适的商业模式是制胜关键,尤其是要不断丰富人工智能应用场景,目前国内外各大模型厂商已经开始了具有广泛、丰富能力的智能服务生态体系构建,大模型之争即将演变为大模型生态之争。

交通银行高度重视人工智能技术发展和应用,“十四五”时期致力于打造人工智能新名片。上半年,交通银行已成立人工智能联合创新实验室,制定GPT大模型建设规划,组建专项团队,加快生成式AI在金融场景的应用,推动人工智能与金融相向而行、融合发展。

第三个观点、应用人工智能需要特别关注几个方面

提五个方面的意见建议:

一是推进产业协同,共生共赢。大模型基础投入大、技术门槛高,在建设过程中可能面临模型优化能力不足、数据算力准备不充分、模型评测体系缺失等不确定性。因此,建议加大产学研合作,构建开放融合生态,建立金融领域可信、安全的生成式AI研究应用生态,积聚行业力量、产业力量,合力解决算力、算法、数据困境。大模型的持续优化需要建立软硬件协同发展的研发生态,不断迭代的大规模分布式训练框架软件,充分发挥高性能硬件的计算能力,实现海量数据下的模型高效训练。并且与传统软件工程不同,大模型的开发模式已从机器语言转向自然语言,研发与应用的落地离不开配套的中间件、数据库、插件等一系列工程化设施,有待国内各方发挥自身优势,合力共建一个便捷使用、繁荣发展的应用生态。

二是持续提升数据供给质量,重视数据安全和隐私保护。金融业合规性、时效性特点,决定了对模型训练数据的质量要求更高、更专业、更精准。通过增加代码语料的训练,提升的不仅是大模型的代码生成能力,也提升了大模型的逻辑能力。因此,要将金融大模型效果发挥到极致,光有金融专业数据是不够的,还需要进一步拓展数据来源,如政务、海关、税收等经济数据,水电煤气等产业公共数据。在此基础上强化数据治理、规范数据标准,持续提升数据标注质量,持续保证数据可信好用、易用能用。在数据安全和隐私保护方面,ChatGPT引发的安全问题已受到各界关注,数据供给和语料训练直接关系信息安全,甚至可能影响国家安全。建议研究建立有效的生成式AI应用内部控制机制,确保训练数据合法依规使用,防止客户信息、核心商业数据等关键信息泄露。

三是强化基础设施前瞻规划与统筹。宏观层面,我国算力产业正进入新一轮发展周期,东数西算、5G网络与大数据等国家重大工程驱动的新型算力网络体系正在形成,算力统筹和智能调度能力持续提高。中国在算力总规模上已走在全球前列,但在微观层面,我国算力市场存在碎片化、区域性、小市场等特征。因此有必要建立国家级的云计算底座作为大模型的基础设施,有效统筹大模型在训练、微调、推理等不同环节所需的算力资源,合理分工,统筹规划,避免大模型基础设施出现低水平重复建设。可以探索建立行业公有云,提供公正、可信的算力用于训练行业通用大模型。针对金融、政务等对数据安全要求较高的场景,可以在行业通用大模型基础上进行专属私有化模型训练。以此来降低生成式AI应用的技术门槛,助力产业数字化、智能化进程。

四是加强监管、关注科技伦理。技术本身是中性的,无所谓善恶。合理应用将帮助人类走向进步,滥用误用将可能引发灾难,核的利用就是最好的例证。当前生成式AI在各领域的应用还处于起步阶段,大模型的高泛化性、生成式特点让AI具有了一定的不可知性和不可控性。对大模型高“智能性”的滥用也已经引发问题,比如近期AI换脸诈骗、AI虚假新闻等频发高发,造成了一定的社会危害。为促进AI健康发展,建议加强对生成式AI应用的科学监管、行业自律及企业自治。要关注生成式AI应用的合理性、准确性、可靠性,建立有效的管控机制和应急策略,避免误导滥用;要关注生成式AI应用的可解释性,尊重社会公德、公序良俗,避免出现价值导向偏离、不公平决策、歧视性内容等伦理问题。

五是注重数字素养的建立和人工智能领域专业人才培养。大模型的出现意味着未来人工智能的技术应用将更具普及化、大众化趋势,这不仅是一项技术变革,更多的将体现为思维、理念、认知变革的过程。如果说20年前,英语是一种技能,开车是一种技能,未来数字化能力也将是一种基本素养。要推动全员全社会提升数字素养和数字技能,以数字化思维改造经营理念、展业习惯和工作方法。同时,大模型的落地需要人才的支撑和保障。生成式AI的诞生与发展,不仅需要大量硬件加速、服务器架构、模型架构、模型算法、数据库等科技人才,还将诞生提示(Prompt)工程师等新职业。金融业要加大自身人才引进和培养,构建技术和业务的专业人才队伍,强化与高校、企业等外部合作,拓宽人工智能人才培养渠道。

各位领导,各位来宾,大模型所代表的公共服务知识体系,未来极有可能成为金融基础设施的重要组成部分。上海具有金融要素市场齐全、科技创新主体集聚的产业优势、技术优势和生态优势,深处大好环境,交通银行将不辱使命,愿携手在座的企业、高校、科研院所,全力推动AI技术的前沿突破,为全社会的数字化转型做出自己应有的贡献。谢谢!

[1] 卷积神经网络是CNN,循环神经网络是RNN,二者都是通过神经网络实现AI能力,RNN在自然语言处理中效果更好。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载