摩根士丹利的AI探索:10万份财务文档训练GPT模型

摩根士丹利,这家公司始终在考量如何利用生成式AI系统协助管理财富。事实上,微软在2022年10月宣布将OpenAI功能整合进自家产品时,也提到了摩根士丹利。过去一年半期间,这家财富管理机构一直在与OpenAI探讨如何更好地应用生成式模型。

最近一段时间,以GPT-4为代表的OpenAI GPT家族震撼了整个世界。新闻报道铺天盖地而来,除了讲述这套最新大语言模型(LLM)的发展历程和对图像的多模态支持能力之外,消息还提到OpenAI正与一些早期客户合作,探索GPT-4如何在其业务体系中发挥作用。

摩根士丹利的AI探索:10万份财务文档训练GPT模型

其中之一正是摩根士丹利,这家公司始终在考量如何利用生成式AI系统协助管理财富。事实上,微软在2022年10月宣布将OpenAI功能整合进自家产品时,也提到了摩根士丹利。过去一年半期间,这家财富管理机构一直在与OpenAI探讨如何更好地应用生成式模型。此次我们有幸与摩根士丹利财富管理数据及分析负责人Jeff McMillan对话,了解该公司在生成式AI领域做出的探索和早期应用。

关于AI财务顾问

摩根士丹利还没有将GPT-4引入实际生产,但对该技术的测试已经进行了很长时间。GPT-4已经确认了超10万份内部文件的内容,并参考16000多名财务顾问对内容提出的质疑,包括:投资建议(我方研究机构如何看待Alphabet股票,其在未来的牛市或熊市背景下将有何表现)、一般业务问题(IBM的五大竞争对手分别是谁?)以及流程问题(应如何将个人退休账户纳入不可撤销信托?)等。利用这10万份文档作为训练语料库,GPT-4针对此类问题接受了“微调训练”。

有些朋友可能对微调训练比较陌生,这里稍做解释。这是一种将GPT-4或ChatGPT的惊人自然语言能力,同特定企业内的具体知识和情况相结合的方法。以往知识管理也曾广受关注,但因为知识与技术之间的嵌入难度过高导致行业迟迟没有突破,如今生成式AI的兴起有望重振这个研究方向。

在对用例的大规模测试中,来自摩根士丹利的300名财务顾问开始对AI系统提出基于各个主题的具体问题。面对AI给出的答案,他们可以选择赞成或反对,也可以在需要时提供更具体的反馈。截至目前,大家对AI的表现评价积极。McMillan对这项创新尤其痴迷,他的团队正在认真研究财务顾问该如何使用这类新系统、在使用过程中遇到哪些问题、能够获得哪些助益,最终又将如何影响客户的参与度等。

超越“幻觉”,维持可靠的时效性

我们还专门询问McMillan,他们在内部文档上使用GPT-4进行的额外训练,是否消除了GPT-4等大语言模型中普遍存在的“幻觉”问题——也就是自信地表达一些纯属捏造的内容。McMillan称还无法断言已经解决这个问题,但从目前的情况看“幻觉”并不严重。他们用于系统微调的文档均经过精心设计,符合正常的知识管理流程且投资意见都经过合规人员的审查。审查流程相当严格,所以不必担心文件中存在不准确的投资建议。

McMillan还提到,摩根士丹利也在限制财务顾问向AI系统中输入的提示类型。OpenAI发现,与GPT系统的长时间对话往往会引发大量幻觉问题,因此在基于GPT-4的Bing聊天机器人等应用场景下对问题规模设定了限制。摩根士丹利还收窄了主题范围,仅允许提出与业务相关的问题,尽可能保证输出结果源自微调训练中使用的相关文件。另外,McMillan也认可了OpenAI的发布声明,表示GPT-4生成幻觉反应的几率确实比GPT-3更低。

摩根士丹利还内置了大量准确性检查。他们每周都会向AI系统提交一组“黄金问题”,用以验证其给出的答案是否准确。在系统的日常使用中,一旦某些内容似乎有所偏差,财务顾问都可以查询原因代码,再根据此代码溯源至作为内容来源的基础文档。目前的大部分大语言模型都做不到这一点,也标志着摩根士丹利通过更好的透明度建立起了独特的AI信任优势。

对于摩根士丹利来说,更大的挑战是如何确保提示所对应的答案具备通用性。例如,假设财务顾问要求分析师对特定公司的股票提出建议,那么需要的肯定是基于最新资讯的推荐结果。这意味着AI模型必须持续利用最新来源的数据接受训练,始终跟进事态的发展和变化。另一方面,如果财务顾问想了解如何更好地建立客户信任,那么所需的信息内容就不太会随时间推移而变化,时效性的重要度也就相对较低。

多个底层模型

事实上,摩根士丹利发现不同类型的内容需要不同的训练方式,也将由此生成不同的底层模型。McMillan表示,“我们需要投入大量时间来考虑不同的内容集,并对各种结果类型做针对性优化。”一套整体模型可能会在10万份摩根士丹利文档之上做微调,而具体模型则仅在特定内容(例如投资研究推荐)上进行微调。当财务顾问给出提示后,系统会确定该主题是否属于投资研究,再进一步使用相关联的模型选项。McMillan对此抱有合理怀疑,认为考虑到大语言模型的训练成本和时间周期都非常夸张,所以最终市面上可能只会剩余少数几种基础大语言模型,各使用方在此之上以不同粒度做进一步微调。

内容质量与组织应用

看到这里,很多朋友可能以为生成式AI的落地已经让数据质量和企业组织失去了意义。事实并非如此,结合摩根士丹利的实际测试,McMillan给出了相反的结论:

对我们来说,高精度管理10万份文档并不是什么问题,因为我们对业务内容始终拥有一流的操作和控制。这些人们并不关心的无聊工作,正是我们获得成功的原因。我们拥有一套存放重要内容的单独仓库,由专项团队负责管理。大语言模型并不能解决数据源分散在企业内各个位置的问题。

很多企业可能已经放弃了知识管理,但摩根士丹利却丝毫没有放松。有了这样组织良好的后端内容,GPT-4等相关技术才能真正成为强大的集成器与描述器。

摩根士丹利还拥有能向客户分发内容的成熟系统。作为业内最强方案之一,他们的“Next Best Action”系统能够通过机器学习识别出个性化的投资思路,并通过CRM系统向特定客户发布重要的想法和信息。McMillan还不确定生成式AI的功能要如何跟这类系统相集成,但他表示Next Best Action的“推送”式设计确实能跟GPT家族的“拉取”提示方式匹配起来。

更多应用场景

摩根士丹利在全球40多个国家/地区拥有8万多名员工并设有办事处。可以看到,如此庞大的组织所创造的智力资本无疑是极难管理的。但通过严格的知识管理流程和生成式AI,整个企业及其客户都可以访问这些知识内容。

这样的应用前景不仅在金融服务领域成立,在咨询、审计、税务和律师等具有类似特征,同样依靠人力密集型服务维持智力资本运营的场景下也仍然适用。相信这些领域的企业也会很快跟随摩根士丹利的脚步,探索出属于自己的生成式AI应用之道。

来源:至顶网软件与服务频道

0赞

好文章,需要你的鼓励

2023

03/21

10:18

分享

点赞

邮件订阅