ZDNet至顶网软件频道消息(文/蒋湘辉): 6月的巴西世界杯鏖战正酣,17日凌晨的德国队和葡萄牙队的交锋引人关注的小组赛之一。而此次德国队的训练和备战和以往相比多了一项大数据分析的武器。德国足协和SAP公司通过联合创新引入SAP Match Insights解决方案,该方案基于SAP HANA平台运行处理海量数据,可以为球员和教练提供一个简明的用户界面,帮助双方开展互动性更强的对话,分析球队训练、备战和比赛情况,从而提升球员和球队的成绩。
图注:在6月举办的SAPPHIRE NOW 2014用户大会期间,SAP工作人员向ZDNet记者演示Match Insights解决方案。(蒋湘辉 摄)
据悉,德国国家队已经在世界杯的早期适应阶段利用 SAP Match Insights 备战,并将在巴西世界杯比赛期间利用该解决方案进行赛后分析。”SAP的参与改变了教练、队员、球迷和媒体的足球体验。设想一下:10个球员用3个球进行有球训练,10分钟就能产生超过700个数据点,而SAP HANA 可以实时处理这些数据。”据SAP 品牌大使的德国国家足球队经理奥利弗评价,“在 SAP 的协助下,我们球队可以实时分析这些海量数据,从而制定培训计划并备战下场比赛。现今,每支运动队都在寻找创新方法以求获得超越对手的竞争优势。我们德国队是世界上最成功的球队之一。德国足协也一直致力于向德国国家队提供最先进的技术来提升球队成绩。SAP 的产品完全符合这些要求。”
SAP 巴西研究院总经理 Stefan Wagner则表示:“世界体育运动一直在发生变化,而且技术创新正在渗透到各个领域,其中包括球迷体验、球员表现监控、球队管理、票务以及赛场运营。德国足协非常愿意引领这场行业变革。在 SAP 解决方案的支持下,我们共同为这场变革做好了充分准备。”
SAP公司近年来强化了对体育产业应用系统的开发,从NBA官网的数据分析到F1迈凯轮车队都有SAP HANA的身影,而此次SAP Match Insights方案丰富了SAP面向体育和娱乐行业的产品组合,预计不久的将来其他俱乐部和足协也能使用这一解决方案。
图注:SAP在SAPPHIRE NOW 2014用户大会期间展示的大数据方案流动车。(蒋湘辉 摄)
据悉,2013 年,SAP 和德国足协宣布建立合作伙伴关系,旨在提升足协的业务流程。最近,双方的合作关系进一步延伸到了联合创新和基于软件的解决方案领域,以期提升德国国家队在赛场上的表现。SAP Match Insights 是致力于实现此类目标的首个项目。此前,德国足协成功实施了基于 SAP HANA 的CRM 快速部署解决方案以及 SAP Event Ticketing 软件,这两款产品都是基于 SAP HANA Enterprise Cloud (SAP HANA 企业云)运行。SAP和德国国家足球队主教练联合创新项目的目标是打造一款创新解决方案,帮助球员提升赛场表现,为世界杯比赛做好准备。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。