已故《纽约客》作家Roger Angell曾将棒球称为“最佳夏季运动”,球场之上也先后涌现过众多影响深远的传奇选手。2022年美国职棒大联盟季后赛即将开战,我们也是时候通过现代数据与分析,借助“魔球理论”回顾自1869年全美第一支职业棒球队辛辛那提红袜队诞生以来,这个职业体育分支如何一路发展至今。

1920至1930年代这几十年间,棒球的普及速度大大加快。纽约洋基队于1921年首次参加世界大赛,到1930年代末参赛总数已多达11次。当时的洋基队由贝比·鲁斯 (Babe Ruth)等球星引领,鲁斯本人还在1927年创造了单赛季本桑打纪录。1960年代,其他职业体育联盟开始迅速崛起,逐渐瓜分了观众对职棒大联盟的关注度。其中最具代表、后来发展最成功的项目,主要有职业橄榄球、篮球、曲棍球所对应的NFL、NBA和NHL。而新技术的出现和计算能力的进步,也让捕捉数据/指标,对专业运动队伍和运动员进行深入统计分析成为可能。
迈克尔·刘易斯(Michael Lewis)在2003年出版的《魔球:如何赢得不公平竞争的艺术》一书,让公众广泛了解到照进职业体育的这一缕数据驱动的新曙光。《魔球》一书讲述了奥克兰运动家队在总经理比利·比恩 (Billy Beane)的领导下,如何利用数据和分析建立起一支预算不高、但竞争力极强的出色球队。这本书后来于2011年被翻拍成电影,由布拉德·皮特饰演力排众议、坚持以数据科学领导球队的比利·比恩。
践行“魔球理论”的前提,在于棒球运动内部人员的集体智慧已经彻底过时——球员、经理、教练、球探和前台,整个体系处处流露出上世纪僵化落后的观念。“魔球理论”认为应当用数据和分析建立起现代指标,进而组建出一支能够同预算可观的大型球队相竞争的“非主流”强队。通过这种反传统的方式,即使是纽约洋基队和洛杉矶道奇队也有可能被所谓“弱队”击败。
扎克.斯科特(Zack Scott)一直积极倡导在职业运动中使用数据和分析技术。斯科特曾在波士顿红袜队担任过18个赛季的顾问,之后又担任过领导职务,包括棒球研发副总裁及执行副总裁/助理总经理。斯科特在任期间,曾直接帮助波士顿红袜队拿下4次世界大赛冠军。此外,斯科特还曾在纽约大都会队担任过一个赛季的高级副总裁和代理总经理。
如今,斯科特专注于帮助各职业体育联盟组织开发并实施数据/技术战略,借此提高赛场表现。通过他的公司Four Rings Sports Solutions,斯科特正积极与参赛团队和高管合作,探索积极创新、增强实力的体育运营之道。斯科特的职业重点以棒球经营为主,涉及球员收购、球员发展和场上战略;业务运营则侧重于票务、出勤和球迷留存等工作。目前,他还努力将这些经验引入其他职业体育联盟,并与NHL建立起合作关系。
斯科特评论称,“从投资水平和量化指标的角度来看,过去二十年间棒球运动中的数据和分析应用可谓高歌猛进。在此期间,我们所关注的数据点已经由最早的10000个增长至如今的100亿个。”他还提到,领先球队的专职数据分析师和软件开发人员的平均数量已增长至18人以上。其中最突出的坦帕湾光线队甚至拥有39名专职数据专家,被斯科特评为值得其他职业体育联盟效法的典范。
专业运动队伍还开始用新的生物力学数据,配合摄像头镜头来构建预测模型。目前,专业运动队伍捕捉和使用最多的正是这类跟踪数据,相应来源包括视频、GPS数据、可穿戴设备、生物力学设备和动作捕捉装置等。利用这些数据,分析人士即可测量运动员的挥棒速度和俯仰速度等变量。将这些数据和分析结论整合到体育运营当中,教练和球探就能把握住那些更加微妙因素,例如防守站位。
斯科特认为,美国职棒大联盟之所以能够长期领先于其他几大职业体育联盟,最核心的原因就是棒球“的精确度高于其他接触性运动”,而且联盟的整体运营规模要大于其他体育项目。但这种差距正在缩小,包括在技术投入等方面,美国橄榄球大联盟NFL去年也首次聘用了首席数据官。
斯科特认为,将数据和分析成功整合进专业运动队伍的关键,在于其是否具备准确衡量结果的能力。只有通过准确的结果,才能证明数据/分析资源与相关解决方案的投资价值。除了以现场比赛结果为标准的短期衡量之外,队伍还必须考虑到“滞后效应”,即需要随时间推移而逐渐显现效果的各类方案战略。
斯科特强调,职业运动队从拥抱数据分析技术到真正在人才发现/培养方面获得收效,其间一般要经过1到3年时间。另外,职业体育的发展历程也适用于其他行业的企业。如同职业队伍需要力争在各赛季中取得好成绩一样,企业也需要给股东交出令人满意的季度/年度经营答卷。
从《魔球》一书中,我们可以看到数据和分析技术在多年普及道路上面临的巨大阻力,特别是由此掀起的颠覆性文化变革。斯科特表示,“数据和分析往往会大大影响过往的运营方式。我们需要消除这种对于数据和分析的担忧,意识到这些只是手段,最终实质仍然是与人打交道。”最后,斯科特指出,使用数据和分析来提高表现,其实也就是在引导职业运动队伍接纳新的思考方式。这是一条由狂人、叛逆者和冒险家们开拓出的光明之路,既适用于职业体育、也同样适用于其他专业方向。
好文章,需要你的鼓励
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
AI代码编辑器开发商Cursor完成23亿美元D轮融资,估值达293亿美元。Accel和Coatue领投,Google、Nvidia等参与。公司年化收入已突破10亿美元。Cursor基于微软开源VS Code打造,集成大语言模型帮助开发者编写代码和修复漏洞。其自研Composer模型采用专家混合算法,运行速度比同等质量模型快四倍。公司拥有数百万开发者用户,将用新资金推进AI研究。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。