在本周日超级碗比赛之前,AWS分享了关于与美国国家橄榄球联盟(NFL)展开合作增强该联盟Next Gen Stats赛事分析系统的细节。
Next Gen Stats系统让NFL可以在直播期间显示比赛的统计信息,增强观看体验。该系统可以显示诸如运动员接球后带球奔跑的码数等信息。Next Gen Stats系统的后端基础设施是托管在AWS上的。
NFL目前正在开发的增强功能将使该系统能够分析球员的各项表现,从而生成新的、更复杂的预测。例如,如果四分卫将球投掷给另一名队员,那么观众有可能会收到关于如果该四分卫把球投给其他人比赛结果会有哪些不同的预测结果。为此,NFL和AWS开发了一种能够执行“Defender Ghosting”的人工智能模型,AWS今天上午也在博客文章中详细介绍了这一模型。
该项目是NFL工程师和AWS机器学习解决方案实验室的科学家共同努力的结果。据AWS称,该模型的目的是预测在球离开四分卫的手之后,防守后卫可能会选择的轨迹,而知道防守后卫会使用哪些战术,对于生成更深入的比赛效率预测来说至关重要。
为了构建这一模型,AWS和NFL必须克服很多技术障碍,最大的难题之一就是数据质量:Next Gen Stats 是通过收集嵌入在球员肩部、足球内部以及整个体育场内的传感器的数据来获得对比赛的分析预期,而这些传感器有时会产生不准确的测量结果。
问题是,NFL之前曾经把其中一些不准确的结果用于该模型的训练数据集中,影响了模型的可靠性。据AWS称,亚马逊机器学习解决方案实验室帮助该联盟的工程师发现问题并开发了解决方案,为了消除训练数据集的错误,AWS的专家创建了一系列规则以过滤不准确的测量信息。
AWS在博客文章中详细介绍说:“通过与NFL的沟通,研究团队排除了所有违反一些基本规则的球员跟踪数据,例如球员的运动轨迹永远都不可能是在球场之外的,而且速度绝对不会超过每秒12.5码(NFL球员最高速度记录是每秒11码)。”
解决了数据质量问题之后,AWS还优化了Defender Ghosting模型的功能。机器学习上下文的特征是模型生成结果所使用的一些因素,例如球员奔跑速度。理想情况下,人工智能是根据对潜在结果影响最大的因素进行计算的。
为了帮助NFL优化该模型的功能,AWS用另一种AI设计方法(称为Gradient Boosting)创建了第二个模型,这种方法的准确性相对低一些。Gradient Boosting在精确度上有局限性,但是在开发过程中,可以让工程师更轻松地找到对结果可靠性影响最大的功能。AWS的科学家利用该模型不那么精确的梯度提升所产生的结果,来增强主版本的精确度。
在这个项目的推动下,目前AWS正在与NFL合作,寻找利用AI增强Next Gen Stats的其他方法。AWS表示:“Defender Ghosting只是AWS科学家为开发Next Gen Stats做做的贡献之一。除此之外,他们正在还在研究计算机视觉是否可以帮助首攻(first down)相关的数据。”
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。