随着多个行业领域对代理式 AI 的热捧,包括应用开发和编程领域,GitHub 终于通过推出 GitHub Copilot 代理模式加入了这个行列。代理式 AI 在开发领域的愿景是让开发者只需要简单的提示就能构建更多代码。新的代理模式将使 Copilot 能够对自己的代码进行迭代并自动修复错误。展望未来,GitHub 还预览了一个完全自主的软件工程代理 Project Padawan,它可以独立处理整个开发任务。
这些新的代理式 AI 功能标志着 GitHub 在 AI 驱动的编程开发领域多年演进的最新进展。微软旗下的 GitHub 首次在 2021 年预览 GitHub Copilot,并于 2022 年正式发布。在 AI 领域,这已经是很久以前的事情了,那时 ChatGPT 还未成为家喻户晓的名字,大多数人也从未听说过"生成式 AI"这个术语。
GitHub 一直在稳步改进 Copilot。最初,该服务依赖于 OpenAI Codex 大语言模型。在 2024 年 10 月,用户获得了从多个大语言模型中进行选择的能力,包括 Anthropic 的 Claude、Google 的 Gemini 1.5 和 OpenAI 的 GPT4o。随着代理模式的推出,GitHub 现在还添加了对 Gemini 2.0 Flash 和 OpenAI 的 o3-mini 的支持。总的来说,微软一直在强调代理式 AI,组建了市场上最大的 AI 代理生态系统之一。
AI 支持的"同伴编程"
新的 GitHub Copilot 代理模式服务的推出,恰逢一系列主要由初创公司领导的竞争对手搅动了开发领域。Cursor、Replit、Bolt 和 Lovable 都在追逐 GitHub 帮助创造的 AI 驱动开发市场。
当 GitHub Copilot 首次出现时,它被定位为一个结对编程工具。现在,随着接受代理式 AI,GitHub 开始倾向于使用"同伴编程"这个术语。
GitHub CEO Thomas Dohmke 表示:"开发团队很快就会有智能的、increasingly 先进的 AI 代理加入,作为日常任务的编程同伴。通过今天推出的 GitHub Copilot 代理模式,开发者可以用一个简单的提示命令在任何组织的代码库中生成、重构和部署代码。"
技术分析:GitHub 新代理架构的工作原理
自首次亮相以来,GitHub Copilot 提供了一系列核心功能。其中包括智能代码补全,即建议执行给定功能的代码片段的能力。Copilot 还可以作为助手,允许开发者输入自然语言查询来生成代码,或获取关于特定代码库的答案。该系统虽然智能,但仍需要相当多的人工交互。
代理模式超越了这些功能。根据 GitHub 的说法,该平台使 Copilot 能够对自己的输出以及输出结果进行迭代。这可以显著改善结果和代码输出。
以下是代理模式操作的详细分析:
任务理解和规划: - 在接收到提示时,代理模式不仅生成代码,还分析完整的任务需求 - 根据 GitHub 的说法,系统可以"推断出未指定但对主要请求工作必要的额外任务"
迭代执行: - 代理对自己的输出和输出结果进行迭代 - 持续迭代直到所有子任务完成
自我修复能力: - 自动识别输出中的错误 - 无需开发者干预即可修复已识别的问题 - 分析运行时错误并实施修正 - 建议并执行必要的终端命令
Project Padawan 为开发带来"原力"
虽然代理模式比基本的 GitHub Copilot 操作更强大,但它仍然不是完全自动化的体验。
为了实现完全自动化,GitHub 正在预览 Project Padawan。在流行文化中,"Padawan"是指《星球大战》科幻系列中的绝地学徒。
Project Padawan 建立在代理模式的基础上,并扩展了更多自动化功能。在博客文章中,Dohmke 指出,Padawan 将允许用户将任务分配给 GitHub Copilot,代理式 AI 系统将处理整个任务。该任务可以包括代码开发、设置存储库和分配人员审查最终代码。
"从某种意义上说,这就像是将 Copilot 作为贡献者加入到 GitHub 上的每个存储库中," Dohmke 说。
GitHub 代理与其他代理式 AI 编程选项的比较
在某些方面,GitHub 是代理式 AI 编程竞赛的后来者。
Cursor AI 和 Bolt AI 在 2023 年推出了它们的第一个 AI 代理,而 Replit 在 2024 年发布了其代理。这些工具已经有一年多的时间进行迭代、获得追随者和建立品牌忠诚度。
我个人在过去几个月一直在试验 Replit 代理。就在本周,该公司将这项技术引入了其移动应用程序,这看似不是什么大事,但确实很重要。无需完整的桌面设置就能使用简单的提示来构建软件的能力是很强大的。Replit 的代理还提供 AI 提示调优,以帮助生成最佳代码。Replit 系统完全在云端运行,像我这样的用户不需要下载任何东西。
Bolt 没有移动应用程序,但它确实有一个非常好的网络界面,让初学者容易上手。Cursor 由于需要下载而显得有点笨重,但它是专业开发人员的强大工具。
那么 GitHub Copilot 代理模式如何比较呢?GitHub 是当今互联网上代码存储库的事实标准。超过 1.5 亿开发者,包括超过 90% 的财富 100 强公司,使用 GitHub。据该公司称,超过 77,000 个组织已采用 GitHub Copilot。这使得该技术非常有粘性。那些已经严重依赖 GitHub 和 Copilot 的组织不会轻易放弃这项技术。
与 Replit 和 Bolt 相比,GitHub Copilot 代理模式目前还不是基于网络的功能。其预览目前仅适用于 VS code 中的 GitHub Copilot。这确实为绝对的新手创造了一个小门槛,但现实是 VS code 可以说是最受欢迎和使用最广泛的集成开发环境 (IDE)。
开发者是一群挑剔的人。这就是为什么有这么多不同的编程语言和框架(似乎每隔一个月就有一个新的 JavaScript 框架出现)。关键在于舒适度和工作流程。对于现有的 GitHub Copilot 和 VS code 用户来说,新的代理模式带来了一个急需的功能,将有助于提高生产力。对于那些没有被束缚在 GitHub Copilot 世界中的人来说,代理模式很可能会帮助 Github Copilot 重新加入关于选择哪种代理式 AI 驱动的编码工具的讨论。
GitHub Copilot 代理模式目前处于预览阶段,需要 VS code insiders(面向早期采用者)。GitHub 尚未提供任何定价详情或正式发布日期。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。