macOS 版 ChatGPT 即将在编程方面变得更加实用。随着应用程序最新更新 (版本 1.2025.057),ChatGPT 现在可以直接在集成开发环境中编辑代码,无需复制粘贴。您可以在 OpenAI 的网站上找到完整的支持 IDE 列表,其中比较值得注意的包括苹果自家的 Xcode、Visual Code Studio,以及 Jetbrains 旗下的 Android Studio 和 PyCharm 等产品。
据 OpenAI 表示,自从公司在去年 11 月发布"works with app"框架以来,IDE 集成一直是 macOS 用户最迫切需求的功能之一。如果您是 Plus、Pro 或 Team 订阅用户,现在就可以开始使用这项集成功能。至于 Enterprise、Edu 和免费用户,更新后的应用程序将于下周推出。
不出所料,这项功能的推出恰逢"vibecoding"(氛围编程)成为流行术语。对于不了解的人来说,vibecoding 是一种使用 ChatGPT 等 AI 工具(当然还有氛围的力量)来编程开发应用程序和游戏的方式。虽然这听起来像是一个玩笑,但 vibecoding 确实是真实存在的。在一段题为"Vibe Coding is the Future"的视频中,Y Combinator 的管理合伙人 Jared Friedman 表示,该创业加速器 W25 批次中有四分之一的项目代码库中 95% 是由 AI 生成的。
Y Combinator 的 CEO Garry Tan 在同一视频中补充道:"这不是一时的风潮,也不会消失。这将成为主导性的编程方式。如果你现在还不这么做,可能就会落后于人。"
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。