谷歌继续着生成式AI之旅,将这项新技术引入了面向开发者的Google Cloud和面向企业的Workspace。
生成式AI已经成为一个热点话题,这项技术能够根据简单的文本描述生成内容,聊天机器人可以进行对话、起草电子邮件、生成代码和创作艺术品,不同于传统AI只能对数据进行分析和分类。
这次Google Cloud团队推出了一系列生成式AI工具,帮助开发人员试水这项新技术,包括支持谷歌的托管机器学习平台Vertex AI,以及一个生成式AI应用构建器,将AI的力量交到企业用户手中。“这是Vertex AI迄今为止最大的更新,”Vertex AI总监Nenshad Bardoliwalla在简报会上告诉记者。
借助Vertex AI对生成式AI的全面支持,数据科学和机器学习团队将能够使用Google的基础模型大规模构建和部署AI应用程序。谷歌表示,这些模型最初可用于生成文本和图像,但会随着时间的推移可扩展至音频和视频。开发人员使用该系统可以探索各种模型,使用自己的数据对其进行微调,修改提示符、并在自己的应用中进行实施。
这次新推出的Generative AI App Builder让业务用户和开发人员能够快速构建新的AI体验,包括机器人、聊天界面、搜索引擎、智能助手等。用户使用这种应用构建器还能获得针对谷歌自己模型直接的API,并可以通过这些API使用预构建的模板快速开始创建自己的应用。
谷歌表示,将从今天开始向有限数量的测试人员开放Generative AI App Builder和Vertex AI支持,其中包括丰田、HCA Healthcare、Mayo Clinic、德意志银行、Automation Anywhere等。有兴趣抢先体验的人可以加入Google Cloud Innovators技术社区。
为了更容易地测试谷歌生成式AI大型语言模型,Google Cloud提供了PaLM API,旨在让开发人员快速访问以快速构建文本生成,例如聊天、摘要和分类。PaLM(Pathways Language Model)是一种高效的AI,可以为大量不同的任务大规模理解和生成语言。
在发布PaLM API的同时,Google Cloud团队还发布了MakerSuite,该工具可以帮助开发人员微调自定义模型、检查数据、构建适当的提示符以创建来自AI的适当响应。开发人员使用MakerSuite可以调整他们最初提供给AI的文本,直到他们得到所需的响应并将其导出为代码。
Google Cloud团队多年来一直在探索AI工作流程,包括使用AI Test Kitchen中的大型语言模型LaMDA和MUM to Search模型构建应用。该团队表示,他们将所学到的关于碎片化工作流程开发的知识与MakerSuite用于实践。开发人员可以使用该工具直接在浏览器中微调他们的模型,从而节省大量的时间和精力。
MakerSuite目前为部分开发人员提供私人预览版,很快就会有候补名单。
除此之外,谷歌还面向那些希望使用谷歌人工智能基础模型访问Google Cloud的企业开放了自己的生态系统合作伙伴计划。生成式AI平台公司,例如AI21 Labs,是一家使用AI构建文本生成和理解功能的初创公司;Osmo,是一家专注于帮助计算机通过人工智能模型检测气味的初创公司;Midjourney,是一个社区支持的人工智能研究实验室,创建主流的AI艺术作品生成器,它们都加入了Google Cloud生态系统。
Google Cloud首席执行官Thomas Kurian在新闻发布会上表示,各种服务的定价将很快公布,但目前没有给出准确的时间表。
Google Workspace中面向企业用户的生成式AI
谷歌还面向有限数量的用户推出了第一套适用于Google Docs和Gmail的AI写作功能,将生成式AI的力量赋予Workspace用户。
很多用户已经在Gmail中体验过某种形式的AI,包括Smart Compose和Smart Reply,其中Smart Compose可以为书面短语提供自动完成建议,Smart Reply则提供了电子邮件的回复建议。但是,现在对于某些Workspace测试人员来说,谷歌将在今年全年陆续推出生成式AI的全部功能。
Workspace用户很快就将可以使用生成式AI功能,通过在一个简单句子中键入他们想要的内容,以起草电子邮件或者文本,并让AI根据他们的写作风格生成潜在的草稿,然后根据语气对其进行微调。在Docs中也可以进行同样的操作,以便在Docs中进行校对、写作和重写。
其他例子还包括快速撰写一封工作电子邮件给厂商或者供应商,然后要求AI帮助调整语气,以确保邮件内容的正式。生成式AI还可以补足会议期间速记的要点,形成完整摘要,使用内部业务文档为团队捕捉洞察。
未来谷歌计划推出的功能还包括为幻灯片自动生成图像、音频和视频,通过Sheet中的自动完成和公式生成功能生成洞察和分析,在Meet中生成获取笔记,并启用工作流程以便在聊天中完成各项工作。
Kurian特别强调了这些新服务的数据隐私,称数据不会用于训练模型,客户数据将被隔离,以确保数据隐私,“这种隔离让客户有信心使用这项技术,同时保持对数据的控制。”
好文章,需要你的鼓励
全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek
阿里巴巴团队推出DeepPHY,这是首个专门评估AI视觉语言模型物理推理能力的综合平台。通过六个不同难度的物理环境测试,研究发现即使最先进的AI模型在物理推理任务中表现也远低于人类,成功率普遍不足30%。更关键的是,AI模型虽能准确描述物理现象,却无法将描述性知识转化为有效控制行为,暴露了当前AI技术在动态物理环境中的根本缺陷。
GitHub CEO声称AI将承担所有编程工作,但现实中AI编程工具实际上降低了程序员的生产效率。回顾编程语言发展史,从Grace Hopper的高级语言到Java等技术,每次重大突破都曾因资源限制和固有思维遭到质疑,但最终都证明了抽象化的价值。当前AI编程工具面临命名误导、过度炒作和资源限制三重困扰,但随着技术进步,AI将有助于消除思想与结果之间的障碍。
AgiBot团队联合新加坡国立大学等机构开发出Genie Envisioner机器人操作统一平台,首次将视频生成技术应用于机器人控制。该系统通过100万个操作视频学习,让机器人能够预测行动结果并制定策略,在多个复杂任务上表现优异,仅需1小时数据即可适应新平台,为通用机器人智能开辟全新路径。