至顶网软件频道消息: 据IDC预测,全球数字信息总量将从现在的33ZB增长到2025年的175ZB。数据的快速增长引发了微软等云厂商的密切关注,这些厂商不仅有自己的数据,还有无数其他企业组织的数据。
为了减轻基础设施带来的压力,微软开发了一种用于压缩数据的尖端系统。今天上午,微软在一个名为Zipline的开源项目下发布了该系统的规范。
微软称,这项技术要比目前业界的常用的压缩软件强大得多。微软Azure硬件基础设施团队总经理Kushagra Vaid在博客文章中,把当下主流的Zlib工具作为对比参考。
Zlib是一个行业标准的压缩库,目前Linux内核、iOS和其他基础软件平台都采用了Zlib。Vaid表示,Zipline的数据压缩率高达是Zlib的2倍,而且,该系统的吞吐量也要高于其他主流压缩工具,并且延迟更低。
这就意味着Zipline可以将工作负载缩小到只是其大小的一部分。微软称,该系统把Azure上的应用程序存储量压缩了92%。对于其他类型的数据——例如来自联网设备的机器数据,Zipline的压缩率会更高。
微软将开源该系统的压缩算法,以及该算法设计运行定制硬件的规范,其中就包括Zipline表现数据操作的低级寄存器传输语言。
“我们预计,随着时间的推移,Project Zipline压缩技术被用于多个市场细分领域,以及网络数据处理、智能SSD、归档系统、云设备、通用微处理器、物联网和边缘设备等使用模式中,”Vaid这样写道。
Zipline并不是微软为开源社区贡献第一个Azure组件。此前,微软曾发布了用于一个人工智能引擎的代码,该引擎被用于支持Azure平台的一些服务。此外,微软开公开了自主研发的Cerberus芯片的原理图,该芯片可保护服务器固件防止被篡改。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。