摩根士丹利的AI探索：10万份财务文档训练GPT模型

摩根士丹利，这家公司始终在考量如何利用生成式AI系统协助管理财富。事实上，微软在2022年10月宣布将OpenAI功能整合进自家产品时，也提到了摩根士丹利。过去一年半期间，这家财富管理机构一直在与OpenAI探讨如何更好地应用生成式模型。

最近一段时间，以GPT-4为代表的OpenAI GPT家族震撼了整个世界。新闻报道铺天盖地而来，除了讲述这套最新大语言模型（LLM）的发展历程和对图像的多模态支持能力之外，消息还提到OpenAI正与一些早期客户合作，探索GPT-4如何在其业务体系中发挥作用。

其中之一正是摩根士丹利，这家公司始终在考量如何利用生成式AI系统协助管理财富。事实上，微软在2022年10月宣布将OpenAI功能整合进自家产品时，也提到了摩根士丹利。过去一年半期间，这家财富管理机构一直在与OpenAI探讨如何更好地应用生成式模型。此次我们有幸与摩根士丹利财富管理数据及分析负责人Jeff McMillan对话，了解该公司在生成式AI领域做出的探索和早期应用。

关于AI财务顾问

摩根士丹利还没有将GPT-4引入实际生产，但对该技术的测试已经进行了很长时间。GPT-4已经确认了超10万份内部文件的内容，并参考16000多名财务顾问对内容提出的质疑，包括：投资建议（我方研究机构如何看待Alphabet股票，其在未来的牛市或熊市背景下将有何表现）、一般业务问题（IBM的五大竞争对手分别是谁？）以及流程问题（应如何将个人退休账户纳入不可撤销信托？）等。利用这10万份文档作为训练语料库，GPT-4针对此类问题接受了“微调训练”。

有些朋友可能对微调训练比较陌生，这里稍做解释。这是一种将GPT-4或ChatGPT的惊人自然语言能力，同特定企业内的具体知识和情况相结合的方法。以往知识管理也曾广受关注，但因为知识与技术之间的嵌入难度过高导致行业迟迟没有突破，如今生成式AI的兴起有望重振这个研究方向。

在对用例的大规模测试中，来自摩根士丹利的300名财务顾问开始对AI系统提出基于各个主题的具体问题。面对AI给出的答案，他们可以选择赞成或反对，也可以在需要时提供更具体的反馈。截至目前，大家对AI的表现评价积极。McMillan对这项创新尤其痴迷，他的团队正在认真研究财务顾问该如何使用这类新系统、在使用过程中遇到哪些问题、能够获得哪些助益，最终又将如何影响客户的参与度等。

超越“幻觉”，维持可靠的时效性

我们还专门询问McMillan，他们在内部文档上使用GPT-4进行的额外训练，是否消除了GPT-4等大语言模型中普遍存在的“幻觉”问题——也就是自信地表达一些纯属捏造的内容。McMillan称还无法断言已经解决这个问题，但从目前的情况看“幻觉”并不严重。他们用于系统微调的文档均经过精心设计，符合正常的知识管理流程且投资意见都经过合规人员的审查。审查流程相当严格，所以不必担心文件中存在不准确的投资建议。

McMillan还提到，摩根士丹利也在限制财务顾问向AI系统中输入的提示类型。OpenAI发现，与GPT系统的长时间对话往往会引发大量幻觉问题，因此在基于GPT-4的Bing聊天机器人等应用场景下对问题规模设定了限制。摩根士丹利还收窄了主题范围，仅允许提出与业务相关的问题，尽可能保证输出结果源自微调训练中使用的相关文件。另外，McMillan也认可了OpenAI的发布声明，表示GPT-4生成幻觉反应的几率确实比GPT-3更低。

摩根士丹利还内置了大量准确性检查。他们每周都会向AI系统提交一组“黄金问题”，用以验证其给出的答案是否准确。在系统的日常使用中，一旦某些内容似乎有所偏差，财务顾问都可以查询原因代码，再根据此代码溯源至作为内容来源的基础文档。目前的大部分大语言模型都做不到这一点，也标志着摩根士丹利通过更好的透明度建立起了独特的AI信任优势。

对于摩根士丹利来说，更大的挑战是如何确保提示所对应的答案具备通用性。例如，假设财务顾问要求分析师对特定公司的股票提出建议，那么需要的肯定是基于最新资讯的推荐结果。这意味着AI模型必须持续利用最新来源的数据接受训练，始终跟进事态的发展和变化。另一方面，如果财务顾问想了解如何更好地建立客户信任，那么所需的信息内容就不太会随时间推移而变化，时效性的重要度也就相对较低。

多个底层模型

事实上，摩根士丹利发现不同类型的内容需要不同的训练方式，也将由此生成不同的底层模型。McMillan表示，“我们需要投入大量时间来考虑不同的内容集，并对各种结果类型做针对性优化。”一套整体模型可能会在10万份摩根士丹利文档之上做微调，而具体模型则仅在特定内容（例如投资研究推荐）上进行微调。当财务顾问给出提示后，系统会确定该主题是否属于投资研究，再进一步使用相关联的模型选项。McMillan对此抱有合理怀疑，认为考虑到大语言模型的训练成本和时间周期都非常夸张，所以最终市面上可能只会剩余少数几种基础大语言模型，各使用方在此之上以不同粒度做进一步微调。

内容质量与组织应用

看到这里，很多朋友可能以为生成式AI的落地已经让数据质量和企业组织失去了意义。事实并非如此，结合摩根士丹利的实际测试，McMillan给出了相反的结论：

对我们来说，高精度管理10万份文档并不是什么问题，因为我们对业务内容始终拥有一流的操作和控制。这些人们并不关心的无聊工作，正是我们获得成功的原因。我们拥有一套存放重要内容的单独仓库，由专项团队负责管理。大语言模型并不能解决数据源分散在企业内各个位置的问题。

很多企业可能已经放弃了知识管理，但摩根士丹利却丝毫没有放松。有了这样组织良好的后端内容，GPT-4等相关技术才能真正成为强大的集成器与描述器。

摩根士丹利还拥有能向客户分发内容的成熟系统。作为业内最强方案之一，他们的“Next Best Action”系统能够通过机器学习识别出个性化的投资思路，并通过CRM系统向特定客户发布重要的想法和信息。McMillan还不确定生成式AI的功能要如何跟这类系统相集成，但他表示Next Best Action的“推送”式设计确实能跟GPT家族的“拉取”提示方式匹配起来。

更多应用场景

摩根士丹利在全球40多个国家/地区拥有8万多名员工并设有办事处。可以看到，如此庞大的组织所创造的智力资本无疑是极难管理的。但通过严格的知识管理流程和生成式AI，整个企业及其客户都可以访问这些知识内容。

这样的应用前景不仅在金融服务领域成立，在咨询、审计、税务和律师等具有类似特征，同样依靠人力密集型服务维持智力资本运营的场景下也仍然适用。相信这些领域的企业也会很快跟随摩根士丹利的脚步，探索出属于自己的生成式AI应用之道。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

摩根士丹利的AI探索：10万份财务文档训练GPT模型

来源：至顶网软件与服务频道

2023

03/21

10:18

分享

点赞

重磅！康迪科技获宁德时代首个重卡换电站设备订单

可实时交互的AI生成世界，腾讯发布的AI框架Yan，会是元宇宙的破局者吗？

CCF HPC China 2025｜联想 AI 基础设施 “一横五纵” 产品矩阵精彩亮相

智能体类型与记忆系统的深度解析

OpenAI CEO计划投入数万亿美元建设AI基础设施

心理学家和心理健康专家推动使用自定义指令让AI成为治疗辅助工具

HPE焕新品牌战略，进一步拓展中国市场合作伙伴生态

浏览器是智能体AI未来的关键吗？Opera和Perplexity这样认为

福特颠覆传统装配线生产模式 制造低成本美国电动车

研究员将OpenAI开源大语言模型逆向还原为无推理"基础模型"

Asmi Linux 13 Debian版本发布：Xfce桌面焕然一新

英伟达发布大规模AI就绪欧洲语言数据集和工具

Google 在 Colab Python 平台推出免费的 Gemini 驱动数据科学助手

SAP Business Suite 重启计划引发用户关注

Anthropic 经济指数 — 企业领导者必知的 10 大 AI 工作场所趋势

TigerGraph 升级图数据库产品，实现更快部署速度和全新预配置方案

AI 数据公司主导 BestBrokers 最新独角兽企业榜单

当人工智能遇上市政债券市场：聊聊算法交易与AI预测

AI 将帮助我们理解参与度的"原因"

NatWest零售银行CDIO：拥抱数字化变革 引入创新技术和体验

Shein在墨西哥市场推出首张联名信用卡

AI数据中心：网络设计和选型标准

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

福特颠覆传统装配线生产模式制造低成本美国电动车

NatWest零售银行CDIO：拥抱数字化变革引入创新技术和体验