AWS已正式发布Mountpoint,一套用于Linux系统的开源客户端,能使用文件API接入S3存储,帮助应用程序像在文件系统中遍历S3文件。请注意,Mountpoint并非针对常规用例所设计,而是专门的数据分析客户端。AWS此前曾介绍称,“使用Mountpoint,文件操作将被映射至指向S3的GET和PUT操作,无需任何代码更改即可将基于文件系统的吞吐量扩展至每秒TB级别。”
Mountpoint演示
但其中也有一些限制。首先,预览版文件系统目前只能以只读方式挂载,其他要正式版发布后才能实现。
AWS在关于Mountpoint的论文中解释道,Mountpoint在设计上故意不提供“功能完备的文件系统或POSIX兼容性”,原因在于文件系统具有“与对象存储相悖且数量惊人的独特属性”,包括会改变文件内容的功能和系统管理操作权限等。因此,Mountpoint决定专注于性能优化,避免任何无法通过S3 API直接执行的操作。论文中提到,Mountpoint的理想用例是“对大型数据集进行横向扩展分析的数据湖类应用”。
文中还说,Mountpoint属于开源项目,使用Rust语言构建而成。早期客户也有意“帮助改进,让Mountpoint获得更丰富的功能”。
Mountpoint遵循S3权限和访问策略,因此需要使用AWS凭证。一种可能性是将IAM(身份和访问管理)角色添加至EC2实例,这样就能自动应用凭证信息。
问题是,市面上已经存在大量第三方客户端,AWS为什么还要费力构建自己的文件系统客户端?毕竟S3FS-FUSE已经能够支持Linux、macOS和FreeBSD等系统,商用ObjectiveFS系统和Rclone则面向Windows平台。
AWS副总裁兼S3总经理Kevin Miller在采访中表示,“客户希望获得更好的性能、稳定性,以及对各类连接工具的官方支持。我们审视了所有连接方案,意识到最好还是从零开始构建新的工具选项。我们以AWS Common Runtime为构建基础,这是我们的SDK库。我们还选择用Rust来编写,这就保证了在不牺牲本机代码性能的前提下获得类型检查和其他内置质量保障优势。”Miller还补充称,Mountpoint受益于“自动推理……可验证S3强一致性等正确性指标。”
很明显,AWS对Mountpoint的实际效果相当满意,其代码将成为“我们过去17年间所见到过的、所有工程软件层面的最佳实践,能够满足大型客户提出的可靠性标准。”
除了Mountpoint,AWS还为S3引入了其他六项新功能,借此纪念S3全面上市17周年(最初亮相于2006年3月14日圆周率日),具体包括:
AWS S3存储目前承载着超280万亿个对象,平均接收过亿个请求。AWS仍在支持初始S3 API,但自首次推出以来也增加了许多新功能。
Miller告诉我们,存储桶配置错误已经成为不少安全问题的根源,但AWS正在努力解决。“今年我们正在调整新存储桶的默认设置,现在的存储桶会默认启用我们的「阻止公共访问」选项。”另外,所有新对象也都将默认加密。
AWS又是如何看待S3 API一步步成长为某种意义上的行业标准?例如,OpenStack就在其对象存储上模拟了S3 REST API。
Miller认为,“其他人对S3 API的复制,其实就是对它价值和实用性的一种重要肯定。但也有一些东西,比如增强校验和支持,包括我们多年来添加的其他功能……其他厂商可能与之兼容、也可能不兼容,但我们认为这些已经不是当下必不可少的核心功能了。”
那AWS会考虑将S3 API或者其中一部分作为官方标准吗?
Miller的回答是,“如果客户真的迫切需要,那我们当然愿意。但我们也有其他很多重要工作需要关注。”
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。