随着多个行业领域对代理式 AI 的热捧,包括应用开发和编程领域,GitHub 终于通过推出 GitHub Copilot 代理模式加入了这个行列。代理式 AI 在开发领域的愿景是让开发者只需要简单的提示就能构建更多代码。新的代理模式将使 Copilot 能够对自己的代码进行迭代并自动修复错误。展望未来,GitHub 还预览了一个完全自主的软件工程代理 Project Padawan,它可以独立处理整个开发任务。
这些新的代理式 AI 功能标志着 GitHub 在 AI 驱动的编程开发领域多年演进的最新进展。微软旗下的 GitHub 首次在 2021 年预览 GitHub Copilot,并于 2022 年正式发布。在 AI 领域,这已经是很久以前的事情了,那时 ChatGPT 还未成为家喻户晓的名字,大多数人也从未听说过"生成式 AI"这个术语。
GitHub 一直在稳步改进 Copilot。最初,该服务依赖于 OpenAI Codex 大语言模型。在 2024 年 10 月,用户获得了从多个大语言模型中进行选择的能力,包括 Anthropic 的 Claude、Google 的 Gemini 1.5 和 OpenAI 的 GPT4o。随着代理模式的推出,GitHub 现在还添加了对 Gemini 2.0 Flash 和 OpenAI 的 o3-mini 的支持。总的来说,微软一直在强调代理式 AI,组建了市场上最大的 AI 代理生态系统之一。
AI 支持的"同伴编程"
新的 GitHub Copilot 代理模式服务的推出,恰逢一系列主要由初创公司领导的竞争对手搅动了开发领域。Cursor、Replit、Bolt 和 Lovable 都在追逐 GitHub 帮助创造的 AI 驱动开发市场。
当 GitHub Copilot 首次出现时,它被定位为一个结对编程工具。现在,随着接受代理式 AI,GitHub 开始倾向于使用"同伴编程"这个术语。
GitHub CEO Thomas Dohmke 表示:"开发团队很快就会有智能的、increasingly 先进的 AI 代理加入,作为日常任务的编程同伴。通过今天推出的 GitHub Copilot 代理模式,开发者可以用一个简单的提示命令在任何组织的代码库中生成、重构和部署代码。"
技术分析:GitHub 新代理架构的工作原理
自首次亮相以来,GitHub Copilot 提供了一系列核心功能。其中包括智能代码补全,即建议执行给定功能的代码片段的能力。Copilot 还可以作为助手,允许开发者输入自然语言查询来生成代码,或获取关于特定代码库的答案。该系统虽然智能,但仍需要相当多的人工交互。
代理模式超越了这些功能。根据 GitHub 的说法,该平台使 Copilot 能够对自己的输出以及输出结果进行迭代。这可以显著改善结果和代码输出。
以下是代理模式操作的详细分析:
任务理解和规划: - 在接收到提示时,代理模式不仅生成代码,还分析完整的任务需求 - 根据 GitHub 的说法,系统可以"推断出未指定但对主要请求工作必要的额外任务"
迭代执行: - 代理对自己的输出和输出结果进行迭代 - 持续迭代直到所有子任务完成
自我修复能力: - 自动识别输出中的错误 - 无需开发者干预即可修复已识别的问题 - 分析运行时错误并实施修正 - 建议并执行必要的终端命令
Project Padawan 为开发带来"原力"
虽然代理模式比基本的 GitHub Copilot 操作更强大,但它仍然不是完全自动化的体验。
为了实现完全自动化,GitHub 正在预览 Project Padawan。在流行文化中,"Padawan"是指《星球大战》科幻系列中的绝地学徒。
Project Padawan 建立在代理模式的基础上,并扩展了更多自动化功能。在博客文章中,Dohmke 指出,Padawan 将允许用户将任务分配给 GitHub Copilot,代理式 AI 系统将处理整个任务。该任务可以包括代码开发、设置存储库和分配人员审查最终代码。
"从某种意义上说,这就像是将 Copilot 作为贡献者加入到 GitHub 上的每个存储库中," Dohmke 说。
GitHub 代理与其他代理式 AI 编程选项的比较
在某些方面,GitHub 是代理式 AI 编程竞赛的后来者。
Cursor AI 和 Bolt AI 在 2023 年推出了它们的第一个 AI 代理,而 Replit 在 2024 年发布了其代理。这些工具已经有一年多的时间进行迭代、获得追随者和建立品牌忠诚度。
我个人在过去几个月一直在试验 Replit 代理。就在本周,该公司将这项技术引入了其移动应用程序,这看似不是什么大事,但确实很重要。无需完整的桌面设置就能使用简单的提示来构建软件的能力是很强大的。Replit 的代理还提供 AI 提示调优,以帮助生成最佳代码。Replit 系统完全在云端运行,像我这样的用户不需要下载任何东西。
Bolt 没有移动应用程序,但它确实有一个非常好的网络界面,让初学者容易上手。Cursor 由于需要下载而显得有点笨重,但它是专业开发人员的强大工具。
那么 GitHub Copilot 代理模式如何比较呢?GitHub 是当今互联网上代码存储库的事实标准。超过 1.5 亿开发者,包括超过 90% 的财富 100 强公司,使用 GitHub。据该公司称,超过 77,000 个组织已采用 GitHub Copilot。这使得该技术非常有粘性。那些已经严重依赖 GitHub 和 Copilot 的组织不会轻易放弃这项技术。
与 Replit 和 Bolt 相比,GitHub Copilot 代理模式目前还不是基于网络的功能。其预览目前仅适用于 VS code 中的 GitHub Copilot。这确实为绝对的新手创造了一个小门槛,但现实是 VS code 可以说是最受欢迎和使用最广泛的集成开发环境 (IDE)。
开发者是一群挑剔的人。这就是为什么有这么多不同的编程语言和框架(似乎每隔一个月就有一个新的 JavaScript 框架出现)。关键在于舒适度和工作流程。对于现有的 GitHub Copilot 和 VS code 用户来说,新的代理模式带来了一个急需的功能,将有助于提高生产力。对于那些没有被束缚在 GitHub Copilot 世界中的人来说,代理模式很可能会帮助 Github Copilot 重新加入关于选择哪种代理式 AI 驱动的编码工具的讨论。
GitHub Copilot 代理模式目前处于预览阶段,需要 VS code insiders(面向早期采用者)。GitHub 尚未提供任何定价详情或正式发布日期。
好文章,需要你的鼓励
本文探讨了如何利用混合智能来超越传统的多元化、公平性和包容性(DEI)议程。作者指出,当前的DEI计划可能加剧分歧,而混合智能则提供了一个统一的框架,强调人类共同的基本维度。文章提出了一个2x4模型,包括4个个人维度和4个集体维度,以此来理解人类经验的普遍性。通过将人工智能与这种自然智能模型相结合,组织可以创造更包容、更有效的工作环境。}
这篇文章介绍了AI芯片初创公司EnCharge的创新技术,该公司声称其模拟人工智能加速器在功耗上仅需传统桌面GPU的一小部分,却能提供相当的计算性能。EnCharge的推理芯片在8位精度下能以1瓦特的功耗提供150 TOPS的AI计算能力。该技术经过多年的研发,旨在通过在内存中进行计算来提高效率,并支持多种AI工作负载。
微软发布了 Majorana 1 量子芯片,这是一个重大突破。该芯片采用拓扑量子比特技术,具有更低的错误率,有望解决量子计算的可扩展性问题。这项技术是微软近 20 年研究的成果,标志着量子硬件取得重要进展,为构建大规模量子计算机铺平了道路。
xAI公司推出的Grok 3模型在各项关键基准测试中表现出色,匹敌或超越了目前最先进的AI模型。尽管训练尚未完成,Grok 3已展现出强大实力。本文探讨了Grok 3可能对AI行业产生的影响,包括加速模型发布周期、验证大规模计算投资的价值,以及推动开源文化的发展等方面。