Napkin AI 的"设计工作室"AI 代理正在改变专业人士创作图形的方式

Napkin AI 是一家创新的 AI 图形设计公司,通过模拟传统设计机构的不同岗位职能,利用 AI 代理快速生成高质量的定制图形。该产品自推出以来获得了 200 万用户,受到专业人士的欢迎。Napkin AI 独特的代理驱动方法和对用户需求的专注,使其在垂直 AI 应用领域脱颖而出。

Napkin AI 这家图形设计公司正在垂直 AI 代理应用这一前沿领域开辟独特的发展道路。

用户只需在 Napkin AI 的网站上输入文字,其模型就能在 5 秒内生成对应的图形表示。

有趣的是,在底层实现上,Napkin 是通过将传统设计工作室中不同的工作角色 —— 文案、设计师、插画师、品牌风格师等,用独立的 AI 代理而不是人类来复制这些离散功能。

自 8 月份推出以来,该产品获得了令人印象深刻的用户增长。据 Napkin 联合创始人兼 CEO Pramod Sharma 透露,目前有 200 万测试用户,相比六周前增长了一倍。

"我们采取了稍微不同的角度,"他在接受 VentureBeat 采访时表示。"我们并不是从'让我们看看图像模型能做什么'开始。事实上,对我们来说这是后话。重点是创建图形需要什么,现在是如何完成的,然后再反向思考。"

Napkin AI 是垂直 AI 代理趋势的一部分

Napkin 是众多新兴创业公司中的一员,这些公司都在用垂直 AI 代理而不是传统 SaaS 模式来服务特定领域。Napkin 展示了这些基于代理的公司能有多高效。公司有 12 人的远程团队,只有 Sharma 一人住在旧金山湾区。这些公司也有望带来巨大的颠覆性,因为它们对特定用例来说更具定制性和功能性。

Napkin AI 的独特之处在于它专注于服务特定需求:帮助非图形设计专家的专业人士创建精美设计,主要用于 PowerPoint 演示。这些用户需要图表和其他插图,而不仅仅是生成式 AI 提供商制作的精美图片 —— 他们希望能够简单轻松地编辑这些图像。这正是 Napkin 所做的:在 5 秒内向用户提供最佳效果后,让用户可以编辑样式、颜色和设计类型。

Napkin AI 代表着第三种方式

Sharma 表示,Napkin 不像大多数其他图像提供商那样使用扩散 AI 模型,因为这些模型不允许用户轻松编辑插图的独特元素,例如饼图的切片或周围文字。通过在 Napkin 产品底层使用服务于特定有用功能的代理,Napkin 的方法代表了"第三种方式"。

第一种方式是现有的图形设计公司如 Adobe 或 Canva 采用的方式,即将 AI 工具附加到传统设计工作流程中。Napkin 没有这样做。它是生成式 AI 优先的,使用技术基于用户提示创建最佳的视觉初稿。然后简化剩余的编辑过程,考虑到大多数用户没有高级设计技能 —— 比如使用 Adobe Creative Cloud 所需的那种技能。

Napkin 也没有采用"第二种方式",即新一代 AI 图像和视频公司 —— 如 MidJourney、Stable Diffusion、Runway、Ideogram 等 —— 以 AI 优先为荣,使用大型扩散模型用高质量图像或视频让用户眼花缭乱。它们之间的区别往往并不明显。然而,Sharma 指出,Napkin 决心不为了技术而沉醉于技术,因为那样做不是以用户为先。

以下是 Napkin AI 的工作原理:它允许用户粘贴文字描述 —— 无论是演示提示、博客摘录还是头脑风暴笔记 —— 并在几秒钟内收到多个高质量的图形选项。这些图形不仅仅是模板,而是可定制的设计,具有可编辑的字体、颜色和布局 —— 但它们易于使用,带有滑动工具。该产品避免了像 Figma 或 Canva 等更复杂工具提供的包含数百个选项的庞大菜单栏。创建图像后,Napkin 允许您以 PNG、PDF 或 SVG 格式导出。

Napkin AI 底层有四个子代理

更有趣的是代理在底层是如何工作的:Napkin 使用一个编排大语言模型 (LLM),主要由 OpenAI 的 GPT-4o mini 驱动,来响应用户的提示。这个 LLM 作为一个代理,将任务委派给一系列具有特定职责的其他子代理。第一个"文本"代理建议可以在设计中使用的文本。第二个"布局"代理查看文本,并决定最适合该文本的特定设计布局。

第三个"图标和插图"代理检查数据库,看是否有匹配文本请求的图标,如果没有,它可能会即时生成图标。最后是第四个"样式"代理,让用户可以用自己的企业颜色和风格定制设计。正如 Sharma 解释的那样,Napkin 对这四个代理没有太多限制,只是要最大化质量和速度。Sharma 表示,在 5 秒内响应是满足客户需求的关键。

每个代理都为整体构图做出贡献,确保生成的图形不仅在美学上令人愉悦,而且符合用户的意图。

第四个样式代理将在下周引入产品,并会随时间推移进行改进,Sharma 解释道。不久,用户将能够上传其企业样式的截图或其他文档,这样图像模型就可以自动生成该风格的图像。Sharma 提到了 Meta 在大概念模型 (LCMs) 领域的研究可能会在这方面有所帮助。不过,目前 Napkin 的代理是一个渲染引擎,通过仪表板为用户提供各种样式选项。

质量和专注作为差异化因素

Napkin 最引人注目的承诺之一是对质量的关注。对 Sharma 来说,目标不仅仅是快速生成视觉效果 —— 而是确保每个图形都值得使用。"我们将您的书面内容转化为真正捕捉您想法精髓的图形,"Sharma 说。"我们意识到在图形方面,好还不够。它必须非常非常棒。否则就失去了意义。"

Sharma 与 Jerome Scholler 共同创立了 Napkin AI,此前他们都对演示文稿的质量感到不满。在创立 Napkin 之前,Sharma 创建了以设计质量著称的教育游戏公司 Osmo。Scholler 是 Osmo 的创始团队成员。Sharma 也是前谷歌员工。

这种对质量的执着延伸到技术基础。与通常缺乏图形语义理解的扩散模型不同,Napkin 的代理驱动平台允许它分离内容、布局和样式等元素。这种解耦允许用户动态修改内容而不失去设计的完整性。

发展和扩张

市场似乎认同 Napkin 的方法。该平台在过去六周内用户数量翻了一番,并显示出强劲的留存率,表明用户喜欢其底层工作流程。使用几周后,Sharma 说:"用户都在说:'给我更多!''你们能扩展目录吗?可能性呢?插图类型呢?'这对我们来说很好,因为我们现在非常专注。"

有趣的是,对于视觉传达来说,某些设计效果很好,而其他设计则不然。例如,人脑可以轻松理解饼图和条形图,但可能更难理解其他设计。"我们在这个领域了解到的是,结构本身并不是无限的,"Sharma 说。"它们是人们通常使用的明确定义的结构或隐喻,但如何呈现它们?如何阐述那个隐喻?这就是创造力发挥作用的地方,我们实际上正在大力扩展这一点。"

该公司筹集了 1000 万美元种子轮融资,并于 2024 年 8 月退出隐身状态。但他们开始研究这个问题已经有三年了。"我可以告诉你这仍然是一个非常困难的问题,"Sharma 说。"人类非常擅长阅读图形,并判断图形是否好。他们可能不知道如何制作一个,但他们可以很快判断一个。"

Napkin AI 的未来

随着 Canva 和 Adobe 等大型企业关注生成式 AI 领域,Napkin AI 的明确差异化可能使其成为收购目标。无论是作为独立的颠覆者还是更大生态系统的关键组成部分,Napkin AI 无疑是生成式 AI 图形领域值得关注的公司。

来源:VentureBeat

0赞

好文章,需要你的鼓励

2025

02/17

12:02

分享

点赞

邮件订阅