观点文章:我习惯性地讽刺性地将微软各种自找麻烦的事件称为该公司"传奇式质量控制方法"的典型例子。虽然几十年前Windows NT的稳健性确实可以称得上"传奇",但任何在近年来不得不使用该公司产品的人可能都会对"质量"这个词提出质疑。
正如因配置错误导致的Azure反复宕机所显示的那样,如今"控制"这个词可能也不太合适。
很难准确指出微软在质量方面究竟是从何时开始出错的。2014年,该公司决定可以不要很多测试人员。Mary Jo Foley报道称,"一大批"测试人员被裁员。微软认为不需要再费心使用传统的代码测试方法。瀑布式开发模式过时了,敏捷开发成为主流。
后果一直难以避免。臭名昭著的Windows 10更新事件(也被称为Windows 10 2018年10月更新)删除了文件,尽管微软在那之后放慢了发布节奏,但质量似乎并没有改善。每隔几周,该公司的"传奇式质量控制方法"就会显现出来,无论是通过更新问题造成的自我伤害,还是更糟糕的情况——由于推出错误的配置更改而导致公司云服务崩溃。
虽然前者还可以理解——Windows生态系统由数亿台设备组成,某些问题不可避免(尽管其他问题不可原谅)——但后者则不能这样说。当然,Azure规模庞大,但对于微软来说,它应该是一个已知的量级。因此,反复向生产环境推出导致客户服务无法运行的更改,这不仅仅是质量控制有问题,更是对该公司能力的质疑。
正如俗话所说:"骗我一次,是你的错。一次又一次地骗我……嗯,我想这让我成为了微软的客户。"
所以也许是时候淘汰"传奇式质量控制方法"这个短语,用更符合实际情况的说法来替代了?
这就需要The Register的读者参与进来,特别是那些处在雷德蒙德恶作剧尖锐末端的人们。
您如何描述微软产品现在的质量,以及该公司最新产品发布前所做的测试量?
遗憾的是,"糟糕透顶"这个词可能会让国际受众感到困惑,而粗俗的词汇可能会被防火墙过滤器拦截。
但情况似乎已经超越了"传奇式质量控制方法"。
Q&A
Q1:微软为什么在2014年裁掉了大量测试人员?
A:2014年,微软决定不再需要传统的代码测试方法,认为可以不要很多测试人员。该公司从瀑布式开发模式转向敏捷开发,Mary Jo Foley报道称当时"一大批"测试人员被裁员。
Q2:Windows 10 2018年10月更新出现了什么严重问题?
A:这次更新被称为"Windows 10更新事件"或"诅咒更新",主要问题是删除了用户文件。这是一个严重的质量控制失误,尽管微软在此事件后放慢了发布节奏,但质量问题似乎并没有得到改善。
Q3:Azure云服务经常出现什么类型的问题?
A:Azure云服务经常因为配置错误导致反复宕机。微软会向生产环境推出错误的配置更改,导致客户服务无法正常运行。虽然Azure规模庞大,但这些问题反映出微软在质量控制和系统管理方面存在严重缺陷。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
延世大学研究团队通过分析AI推理过程中的信息密度模式,发现成功的AI推理遵循特定规律:局部信息分布平稳但全局可以不均匀。这一发现颠覆了传统的均匀信息密度假说在AI领域的应用,为构建更可靠的AI推理系统提供了新思路,在数学竞赛等高难度任务中显著提升了AI的推理准确率。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
蒙特利尔大学团队发现让AI"分段思考"的革命性方法Delethink,通过模仿人类推理模式将长篇思考分解为固定长度块,仅保留关键信息摘要。1.5B小模型击败传统大模型,训练成本降至四分之一,计算复杂度从平方级降为线性级,能处理十万词汇超长推理,为高效AI推理开辟新道路。