已故《纽约客》作家Roger Angell曾将棒球称为“最佳夏季运动”,球场之上也先后涌现过众多影响深远的传奇选手。2022年美国职棒大联盟季后赛即将开战,我们也是时候通过现代数据与分析,借助“魔球理论”回顾自1869年全美第一支职业棒球队辛辛那提红袜队诞生以来,这个职业体育分支如何一路发展至今。
1920至1930年代这几十年间,棒球的普及速度大大加快。纽约洋基队于1921年首次参加世界大赛,到1930年代末参赛总数已多达11次。当时的洋基队由贝比·鲁斯 (Babe Ruth)等球星引领,鲁斯本人还在1927年创造了单赛季本桑打纪录。1960年代,其他职业体育联盟开始迅速崛起,逐渐瓜分了观众对职棒大联盟的关注度。其中最具代表、后来发展最成功的项目,主要有职业橄榄球、篮球、曲棍球所对应的NFL、NBA和NHL。而新技术的出现和计算能力的进步,也让捕捉数据/指标,对专业运动队伍和运动员进行深入统计分析成为可能。
迈克尔·刘易斯(Michael Lewis)在2003年出版的《魔球:如何赢得不公平竞争的艺术》一书,让公众广泛了解到照进职业体育的这一缕数据驱动的新曙光。《魔球》一书讲述了奥克兰运动家队在总经理比利·比恩 (Billy Beane)的领导下,如何利用数据和分析建立起一支预算不高、但竞争力极强的出色球队。这本书后来于2011年被翻拍成电影,由布拉德·皮特饰演力排众议、坚持以数据科学领导球队的比利·比恩。
践行“魔球理论”的前提,在于棒球运动内部人员的集体智慧已经彻底过时——球员、经理、教练、球探和前台,整个体系处处流露出上世纪僵化落后的观念。“魔球理论”认为应当用数据和分析建立起现代指标,进而组建出一支能够同预算可观的大型球队相竞争的“非主流”强队。通过这种反传统的方式,即使是纽约洋基队和洛杉矶道奇队也有可能被所谓“弱队”击败。
扎克.斯科特(Zack Scott)一直积极倡导在职业运动中使用数据和分析技术。斯科特曾在波士顿红袜队担任过18个赛季的顾问,之后又担任过领导职务,包括棒球研发副总裁及执行副总裁/助理总经理。斯科特在任期间,曾直接帮助波士顿红袜队拿下4次世界大赛冠军。此外,斯科特还曾在纽约大都会队担任过一个赛季的高级副总裁和代理总经理。
如今,斯科特专注于帮助各职业体育联盟组织开发并实施数据/技术战略,借此提高赛场表现。通过他的公司Four Rings Sports Solutions,斯科特正积极与参赛团队和高管合作,探索积极创新、增强实力的体育运营之道。斯科特的职业重点以棒球经营为主,涉及球员收购、球员发展和场上战略;业务运营则侧重于票务、出勤和球迷留存等工作。目前,他还努力将这些经验引入其他职业体育联盟,并与NHL建立起合作关系。
斯科特评论称,“从投资水平和量化指标的角度来看,过去二十年间棒球运动中的数据和分析应用可谓高歌猛进。在此期间,我们所关注的数据点已经由最早的10000个增长至如今的100亿个。”他还提到,领先球队的专职数据分析师和软件开发人员的平均数量已增长至18人以上。其中最突出的坦帕湾光线队甚至拥有39名专职数据专家,被斯科特评为值得其他职业体育联盟效法的典范。
专业运动队伍还开始用新的生物力学数据,配合摄像头镜头来构建预测模型。目前,专业运动队伍捕捉和使用最多的正是这类跟踪数据,相应来源包括视频、GPS数据、可穿戴设备、生物力学设备和动作捕捉装置等。利用这些数据,分析人士即可测量运动员的挥棒速度和俯仰速度等变量。将这些数据和分析结论整合到体育运营当中,教练和球探就能把握住那些更加微妙因素,例如防守站位。
斯科特认为,美国职棒大联盟之所以能够长期领先于其他几大职业体育联盟,最核心的原因就是棒球“的精确度高于其他接触性运动”,而且联盟的整体运营规模要大于其他体育项目。但这种差距正在缩小,包括在技术投入等方面,美国橄榄球大联盟NFL去年也首次聘用了首席数据官。
斯科特认为,将数据和分析成功整合进专业运动队伍的关键,在于其是否具备准确衡量结果的能力。只有通过准确的结果,才能证明数据/分析资源与相关解决方案的投资价值。除了以现场比赛结果为标准的短期衡量之外,队伍还必须考虑到“滞后效应”,即需要随时间推移而逐渐显现效果的各类方案战略。
斯科特强调,职业运动队从拥抱数据分析技术到真正在人才发现/培养方面获得收效,其间一般要经过1到3年时间。另外,职业体育的发展历程也适用于其他行业的企业。如同职业队伍需要力争在各赛季中取得好成绩一样,企业也需要给股东交出令人满意的季度/年度经营答卷。
从《魔球》一书中,我们可以看到数据和分析技术在多年普及道路上面临的巨大阻力,特别是由此掀起的颠覆性文化变革。斯科特表示,“数据和分析往往会大大影响过往的运营方式。我们需要消除这种对于数据和分析的担忧,意识到这些只是手段,最终实质仍然是与人打交道。”最后,斯科特指出,使用数据和分析来提高表现,其实也就是在引导职业运动队伍接纳新的思考方式。这是一条由狂人、叛逆者和冒险家们开拓出的光明之路,既适用于职业体育、也同样适用于其他专业方向。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。