谷歌继续着生成式AI之旅,将这项新技术引入了面向开发者的Google Cloud和面向企业的Workspace。
生成式AI已经成为一个热点话题,这项技术能够根据简单的文本描述生成内容,聊天机器人可以进行对话、起草电子邮件、生成代码和创作艺术品,不同于传统AI只能对数据进行分析和分类。
这次Google Cloud团队推出了一系列生成式AI工具,帮助开发人员试水这项新技术,包括支持谷歌的托管机器学习平台Vertex AI,以及一个生成式AI应用构建器,将AI的力量交到企业用户手中。“这是Vertex AI迄今为止最大的更新,”Vertex AI总监Nenshad Bardoliwalla在简报会上告诉记者。
借助Vertex AI对生成式AI的全面支持,数据科学和机器学习团队将能够使用Google的基础模型大规模构建和部署AI应用程序。谷歌表示,这些模型最初可用于生成文本和图像,但会随着时间的推移可扩展至音频和视频。开发人员使用该系统可以探索各种模型,使用自己的数据对其进行微调,修改提示符、并在自己的应用中进行实施。
这次新推出的Generative AI App Builder让业务用户和开发人员能够快速构建新的AI体验,包括机器人、聊天界面、搜索引擎、智能助手等。用户使用这种应用构建器还能获得针对谷歌自己模型直接的API,并可以通过这些API使用预构建的模板快速开始创建自己的应用。
谷歌表示,将从今天开始向有限数量的测试人员开放Generative AI App Builder和Vertex AI支持,其中包括丰田、HCA Healthcare、Mayo Clinic、德意志银行、Automation Anywhere等。有兴趣抢先体验的人可以加入Google Cloud Innovators技术社区。
为了更容易地测试谷歌生成式AI大型语言模型,Google Cloud提供了PaLM API,旨在让开发人员快速访问以快速构建文本生成,例如聊天、摘要和分类。PaLM(Pathways Language Model)是一种高效的AI,可以为大量不同的任务大规模理解和生成语言。
在发布PaLM API的同时,Google Cloud团队还发布了MakerSuite,该工具可以帮助开发人员微调自定义模型、检查数据、构建适当的提示符以创建来自AI的适当响应。开发人员使用MakerSuite可以调整他们最初提供给AI的文本,直到他们得到所需的响应并将其导出为代码。
Google Cloud团队多年来一直在探索AI工作流程,包括使用AI Test Kitchen中的大型语言模型LaMDA和MUM to Search模型构建应用。该团队表示,他们将所学到的关于碎片化工作流程开发的知识与MakerSuite用于实践。开发人员可以使用该工具直接在浏览器中微调他们的模型,从而节省大量的时间和精力。
MakerSuite目前为部分开发人员提供私人预览版,很快就会有候补名单。
除此之外,谷歌还面向那些希望使用谷歌人工智能基础模型访问Google Cloud的企业开放了自己的生态系统合作伙伴计划。生成式AI平台公司,例如AI21 Labs,是一家使用AI构建文本生成和理解功能的初创公司;Osmo,是一家专注于帮助计算机通过人工智能模型检测气味的初创公司;Midjourney,是一个社区支持的人工智能研究实验室,创建主流的AI艺术作品生成器,它们都加入了Google Cloud生态系统。
Google Cloud首席执行官Thomas Kurian在新闻发布会上表示,各种服务的定价将很快公布,但目前没有给出准确的时间表。
Google Workspace中面向企业用户的生成式AI
谷歌还面向有限数量的用户推出了第一套适用于Google Docs和Gmail的AI写作功能,将生成式AI的力量赋予Workspace用户。
很多用户已经在Gmail中体验过某种形式的AI,包括Smart Compose和Smart Reply,其中Smart Compose可以为书面短语提供自动完成建议,Smart Reply则提供了电子邮件的回复建议。但是,现在对于某些Workspace测试人员来说,谷歌将在今年全年陆续推出生成式AI的全部功能。
Workspace用户很快就将可以使用生成式AI功能,通过在一个简单句子中键入他们想要的内容,以起草电子邮件或者文本,并让AI根据他们的写作风格生成潜在的草稿,然后根据语气对其进行微调。在Docs中也可以进行同样的操作,以便在Docs中进行校对、写作和重写。
其他例子还包括快速撰写一封工作电子邮件给厂商或者供应商,然后要求AI帮助调整语气,以确保邮件内容的正式。生成式AI还可以补足会议期间速记的要点,形成完整摘要,使用内部业务文档为团队捕捉洞察。
未来谷歌计划推出的功能还包括为幻灯片自动生成图像、音频和视频,通过Sheet中的自动完成和公式生成功能生成洞察和分析,在Meet中生成获取笔记,并启用工作流程以便在聊天中完成各项工作。
Kurian特别强调了这些新服务的数据隐私,称数据不会用于训练模型,客户数据将被隔离,以确保数据隐私,“这种隔离让客户有信心使用这项技术,同时保持对数据的控制。”
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。