AI 模型只需几个词就能创作故事、图像,甚至短片。但据 Weber Wong 所说,这些模型都是"由非创意人士开发,供其他非创意人士体验创意"。
换句话说,这些工具并不是为真正的创意专业人士设计的。这正是 Wong 希望通过他作为创始人兼 CEO 的新创企业 Flora 来改变的现状。
Flora 本周正式发布,并发表了一份宣言,声明"AI 创意工具不应仅仅是生成 AI 垃圾的玩具",并描述 Wong 和他的团队"致力于打造一款将深刻影响创意工作未来的专业工具"。
该宣言将 Flora 定位为一款不同于现有 AI 工具的产品。现有工具"让创作变得容易,但缺乏创意控制",而传统创意软件则"提供控制,但不够直观且耗时"。
Flora 并不致力于开发更好的生成式 AI 模型。Wong 认为创业公司的关键洞察之一是"模型本身并不是创意工具"。相反,Flora 提供了一个"无限画布",与现有模型集成 —— 这是一个可以生成文本、图像和视频的可视化界面。
"模型不重要,技术也不重要,"Wong 告诉我,"关键在于界面。"
例如,用户可以先提示 Flora 创建一朵花的图像,然后询问图像细节,这些细节会引导更多提示和不同变体,每个步骤和变体都会映射到上述画布上,还可以与客户协作分享。
Wong 表示,他希望 Flora 能服务于所有艺术家和创意人士,但公司初期将重点与视觉设计机构合作。事实上,他们正在根据著名设计公司 Pentagram 设计师的反馈迭代产品。
Wong 表示,目标是让 Pentagram 的设计师能"完成更多创意工作",比如创建一个标志设计,然后快速生成 100 个变体。他将其比作音乐创作的演变 —— 从莫扎特"需要整个管弦乐队来演奏他的音乐",到现在的音乐人可以"在新泽西的车库里用 Ableton 完成所有工作,然后发布到 SoundCloud 上"。
Flora 目前免费提供有限数量的项目和生成内容,专业版定价从每月 16 美元起。
好文章,需要你的鼓励
TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。
澳大利亚国立大学和广湾大学研究团队开发的VAU-R1系统通过强化学习显著提升了视频异常理解能力。该研究不仅创建了第一个专门用于训练和评估视频异常理解的思维链基准数据集VAU-Bench,还提出了一种数据高效的强化微调框架,使模型能更准确地回答问题、定位异常时间段并提供连贯解释。实验结果表明,VAU-R1在多项选择题准确率和时间定位方面比传统方法有显著提升,为安全监控、灾害预警等领域的智能系统带来了新的可能性。
Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。
这项研究由香港中文大学团队提出了视频-3D几何大语言模型(VG LLM),一种无需依赖显式3D数据输入,仅通过普通视频就能理解3D世界的创新方法。通过集成3D视觉几何编码器,该模型能从视频序列中提取3D先验信息,显著提升空间推理能力。实验表明,该4B参数模型在多项3D场景理解和空间推理任务上超越了现有技术,甚至在VSI-Bench评估中胜过Gemini-1.5-Pro。