2022 年5月30日消息,IBM表示,从麦当劳手上收购了自动下单技术以及该技术的开发团队之后,该公司正在将其自然语言处理(NLP)软件推广到这家快餐连锁公司的更多得来速餐厅。
去年,IBM已经为其Watson Discovery 企业AI服务增加了额外的NLP功能,现在汉堡巨头的AI聊天机器人也将得益于此。
去年10月,IBM狼吞虎咽地收购了McD Tech Labs——麦当劳于2019年收购AI语音识别初创公司Apprente,并将其更名为McD Tech Labs。
自动下单已经于2021年6月在芝加哥的10家Mcshacks店进行了试点,据报道,在使用AI得来速机器人下的每五个订单中,大约有四个不需要人工干预。
在摩根大通第50届全球技术、媒体和通信年会(50th Annual Global Technology, Media and Communications)上,IBM的全球市场营销高级副总裁Rob Thomas表示,IBM正在“接手他们(麦当劳)在下单方面遇到困难的业务。”
他表示,IBM围绕着自动下单技术(AOT)“大做文章”,他表示:“我们可以使用我们非常棒的自然语言处理技术来增强麦当劳的技术。”“我们现在开始将其推广到他们的很多门店,最终将推广到他们所有的门店。”
他表示,在“工资飞涨”的年代,对于需要“快速服务”的餐厅,这是“伟大的技术应用”。
“我们可以在不需要人工干预的情况下,完成所有的得来速下单,隔一段时间会有些情况需要人类处理,但是它通过软件、AI以及创造性构造的力量,为这家特许经营商带来了巨大的经济效益。”
Thomas没有透露更多关于IBM集成到AOT中的软件的细节。我们已经请求该公司给出更多的评论。
全球数以万计的麦当劳门店都有得来速选项,其中95%的餐厅都在美国。自从2020年3月疫情蔓延以来,这个最大市场中70%的销售都来自得来速。
在麦当劳2021年第三季度(日历季)的财报电话会议上,首席执行官Chris Kempczinski在谈到将Tech Lab 出售给 IBM 时表示,这是为了将开发工作交给“一个可以发展它,并在全球范围内进行扩展的合作伙伴。”
他表示,有大约100名员工在Tech Lab工作,他对这些员工的工作进展感到高兴,这些员工已经被转移到了IBM。“但是在引入其他语言、能够在1.4万家餐厅使用不同的菜单排列等方面,仍然有很多工作要做。而这项工作超出了我们核心竞争力的范围。”
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。