周末,世界上最著名的芬兰人发布了最新版本的Linux内核,并警告即将到来的开发干扰。
Linux内核6.16在一个相对轻松的开发周期结束后正式发布。据我们推测,这可能被解读为对某些文件系统开发者的微妙讽刺,但话说回来,Torvalds从来不以含蓄著称。
就内核发布而言,这个版本几乎异常低调。它没有任何重大的新功能,但确实包含了大量的错误修复和代码。Phoronix估计它拥有3840万行代码,分布在超过78000个文件中。还记得UNIX的核心设计理念是小巧、简洁和干净吗?嗯,我也不记得了,因为在The Reg FOSS台首次接触计算机键盘的时候,UNIX System III就已经发布了,这是首个统一不同代码库的版本之一,也是AT&T首批商业版本之一。但这确实是当初的理念,不是吗?
内核6.16支持英特尔2023年高级性能扩展,这意味着改进的向量指令和通用寄存器数量翻倍。不过,只有特定的CPU型号才能从新向量指令的全宽度版本中受益,这可以说是导致英特尔近年来失利的那种举措的一个例子。
两个内置文件系统获得了性能优化,支持更大的单个数据块。在世纪之交由SGI开源的XFS现在获得了更大的原子写入支持。与此同时,ext4获得了bigalloc和大页面支持,这可以使某些操作快约三分之一。Btrfs和NFS也都获得了调整。
在几乎任何Unix系统上,当程序崩溃时,它会发出核心转储并将其保存在当前工作目录中。在其他改进中,现在核心转储可以通过AF_SOCKET发送。这意味着功能改进和安全性改进。
在大型机器上,Linux对NUMA系统的支持现在可以自动自调节,还有其他优化。正如The Register在AMD将其引入x86时解释的那样。对五级页表的支持允许巨大的虚拟内存量,正如LWN 2017年的文章所解释的。
在小型设备上,内核现在可以将声音解码卸载到USB硬件,追赶上了板载声卡芯片——这个变化花了数年时间才得以实现。
我们不禁感到这两点展示了Linux所用设备的惊人范围。难怪它变得如此庞大。
我们上面链接的声音卸载解释来自Linux Weekly News关于本次合并窗口新内容的两部分综述:第一部分和第二部分的链接提供了真正的细节,以及概述。"内核新手"网站为真正的核心用户提供了一个大总结。
Linus在他的公告中还指出,他将在6.17合并窗口期间大量出行,这可能会造成干扰。一方面,这可能算作对开发者的警告,但这也提醒我们在这个开发者金字塔的顶端只有一个人。这让我们思考操作系统内核开发的下一个重大变化是否会在他退休时到来,而不是在任何技术里程碑时刻。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。