每次航班延误都有其发生原因,但乘客却往往无法了解事件全貌。美国联合航空公司正在努力改变这一现状,尝试将工作人员与生成式AI相结合为乘客提供更多背景信息,希望让令人沮丧的消息变得更加容易接受。
假设我们正身在旧金山等待飞往图森的航班。过去,大家可能会突然收到一条模板式消息,提醒由于飞机到达时间晚于预期而发生延误。现在,AI能够扫描飞行系统并在员工审核之后发送提醒,让乘客知晓延误是由旧金山机场跑道施工而引发。
AI辅助消息标志着“每次航班延误都有其理由”。这是美联航于2018年就推动的一项举措,希望能在出现问题时为乘客提供更多说明。美联航很清楚,关于航班问题的透明信息能够在乘客当中建立信任,哪怕是增添极微小的细节也将对客户满意度指标产生积极的影响。
借助生成式AI,美联航约由15人组成的延误解释团队获得了一种新工具,能够帮助他们处理更多信息并向乘客公布更多细节。这在繁忙的夏季出行季显得尤为重要。自今年早些时候发布以来,已经有约6000个航班至少伴随一条生成式AI辅助信息,而且计划规模仍在迅速扩大。
美联航首席信息官Jason Birnbaum表示,“这是为了扩大该团队的服务覆盖范围。如果我们能使用生成式AI更频繁地与更多受众展开交流,将进一步推动公司的净推荐值,也就是市场口碑。”
每次航班延误都有其理由只是美联航在运营体系内应用AI技术的一个领域,也是Birnbaum努力推动的方向之一,目标是让团队成员的工作更轻松,并通过技术为乘客提供更加个性化的出行体验。这项计划也让更多人了解到像美联航这样的大企业如何将生成式AI整合进日常运营当中,相关团队又是如何应对新技术协同所带来的机遇和挑战。
AI学习曲线
美联航运营解决方案总监Dennis Lawrence将延误解释团队的工作描述为一种语言体操。每当出现复杂的延误状况,他们都会将运营数据、有时候甚至是将机组成员的行业术语转化成易于理解的形式,生成能够安抚客户情绪的简洁提醒。
如今,生成式AI正在帮助团队成员做出进一步探索,包括自主扫描系统与数据、获取必要背景信息并起草一条可供团队审查的拟议信息。
美联航的延误解释团队拥有一套独立门户,该门户会在标准提醒之外添加AI生成的消息。在对AI生成消息的准确性、语法正确性以及是否符合美联航文风要求等情况进行检查之后,团队成员可以决定是否发出,或者将AI生成结果发回修改。而生成式AI则相当于给该团队提供了一套起始模板,再由成员做更多润色。
但AI偶尔也会犯错。有时候,它写的句子会包含语法错误,或者跟实际延误原因无关。这就需要人类发挥自己的判断力并提供反馈,在训练模型的同时,又可保证客户不致收到不够准确的提醒内容。
Lawrence表示,“我们需要不断迭代,并建立一个由人类参与循环并频繁进行修改的流程。”
除了批准或打回个别消息之外,延误解释团队成员还与提示词工程师及更多其他同事合作,了解某些消息为何成功或者失败。之后工程师会更新模型,避免下次再犯同样的错误。各团队每天都会聚在一起,讨论哪些尝试进展顺利、而哪些流程亟待改进。
延误解释团队面临的最大变化,就是每天需要收取更多信息。各位成员有大约三分钟时间来评估并核准消息,以确保乘客能及时收到通报。而如果时间耗尽,作为保护措施,AI生成的消息将会默认被弃用。
随着AI在美联航发挥越来越大的作用,“每次航班延误都有其理由”团队也开始对AI采取迭代方法、建立适当护栏并逐步适应新技术所带来的学习曲线。
Lawrence指出,“起步阶段并不要求效果完美,但迈出第一步非常重要。”
AI辅助下的新未来
随着“每次航班延误都有其理由”团队的不断发展,Birnbaum与美联航技术团队正忙于探索AI辅助叙事的新形态,以及生成式AI能够产生积极影响的更多其他方式。
在叙事方面,这可能包括与AI合作以围绕重大事件生成消息。在今年早些时候的NBA全明星赛期间,乘客们就收到“预计今日安检线将受到全场紧逼”,并提醒他们“提前抵达以避免压哨压力。”
其他项目还包括UnitedGPT,这是OpenAI ChatGPT 4.0的一套修改版本,可以在美联航设备上安全使用。该公司还在寻找提高联络中心执行效率的方法,通过使用AI来预计电子邮件并做出适当回应,从而减少解决问题所耗费的时间。
Birnbaum表示,在美联航,AI技术“正帮助我们加快抵达目的地的脚步。”他同时补充称,最重要的始终是人。“当我们为员工提供有助于工作的工具和数据之后,客户也将获得超越以往的出行体验。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。