Canva 正在推出一系列由生成式 AI 驱动的新工作空间工具,试图将 Microsoft、Google 和 Adobe 的功能整合到一个单一平台上。Canva 的可视化套件正在进行重新设计,将其设计和生产力工具整合到一个统一界面中,同时增加了新的编码、照片编辑、电子表格和 AI 聊天机器人功能。
这些新功能加入了 2022 年推出的办公套件工具系列,如 Canva Docs 和 Canva Whiteboards —— Canva 对 Microsoft Word、Google Docs 和 FigJam 等服务的回应。在确立了其作为营销和设计平台的地位后,Canva 现在希望通过为传统工作空间应用程序提供可视化改进,将更多办公团队和企业吸引到其 2.3 亿用户社区中。
Visual Suite 2.0 更新允许用户在单个设计中构建和编辑文档、演示文稿、动画和网站,为团队提供了一个统一的格式,可以同时协作处理多个任务。Canva 在其新闻稿中表示:"这消除了对独立工具、分散工作流程和不连贯文件的需求。从规划和简报到设计和交付的整个活动流程现在可以在一个无缝的协作空间中完成。"
团队现在可以使用标签窗口同时处理 Canva 项目的不同方面。
Canva Sheets 是对传统电子表格构建应用程序的创新尝试,允许用户将文本与视觉资产结合使用。根据 Canva 的说法,数据可以从 HubSpot、Statista、Google Analytics 等平台导入,而公司的 AI 驱动的"Magic Insights"功能会自动扫描数据以识别显著的模式或要点。数据还可以使用"Magic Charts"转换为各种交互式图表,旨在帮助用户轻松将原始数据转换为信息图表、报告和动画可视化内容。
Canva Code 是一个类似于 Gemini Code Assist 或 Microsoft 旗下 GitHub Copilot 的生成式 AI 编码助手。根据 Canva 的说法,用户可以通过文本提示生成小部件、网站和其他交互式内容,"无需编码或外部工具"。
同时,Canva 的新 AI 聊天机器人 —— 公司将其描述为"对话式创意伙伴" —— 将 Canva 的所有生成式 AI 工具整合到一个窗口中,使用户更容易快速访问。用户可以使用语音或文本提示来编辑照片、调整设计大小以及生成文本、幻灯片和图像。
在创意方面,Canva 还更新了其照片编辑器,加入了类似于 Adobe 在其专业 Photoshop 软件中引入的功能。照片编辑器现在允许用户通过点击来自动修改或删除背景对象,并创建能够"考虑照明和布局"的 AI 生成背景。
好文章,需要你的鼓励
这项研究由新加坡国立大学团队开发的DualParal技术,通过创新的双重并行架构解决了AI视频生成的长度限制问题。该方法同时在时间帧和模型层两个维度实现并行处理,配合分块降噪机制、特征缓存和协调噪声初始化策略,使生成分钟级长视频成为可能。实验表明,在生成1,025帧视频时,DualParal比现有技术减少了高达6.54倍的延迟和1.48倍的内存成本,同时保持了高质量的视频输出,为内容创作者提供了生成更长、更复杂视频叙事的新工具。
SoloSpeech是约翰霍普金斯大学研究团队开发的创新语音处理技术,针对"鸡尾酒会效应"问题提出了全新解决方案。该系统通过级联生成式管道整合压缩、提取、重建和校正过程,实现了高质量目标语音提取。与传统判别式模型相比,SoloSpeech采用无需说话者嵌入的设计,直接利用提示音频的潜在空间信息与混合音频对齐,有效避免特征不匹配问题。在Libri2Mix及多个真实世界数据集上的评测显示,SoloSpeech在清晰度、质量和泛化能力上均达到了领先水平,为语音分离技术开辟了新方向。
这项由北京大学深圳研究生院、伟湾大学、腾讯ARC实验室和兔小贝智能联合研究的Sci-Fi框架,通过创新的对称约束机制,解决了视频帧间插值中的关键问题。研究团队设计了轻量级EF-Net模块,增强结束帧约束力,使其与起始帧形成平衡影响,从而生成更自然流畅的中间过渡帧。实验证明,该方法在各种场景下都优于现有技术,特别适用于电影制作、动画创作和视频编辑领域,显著降低了人力成本。
这项来自西北大学和谷歌的研究突破了传统马尔可夫强化学习的局限,通过贝叶斯自适应RL框架解释了大语言模型中涌现的反思性推理行为。研究团队提出的BARL算法通过维护多个解题策略的后验分布,指导模型何时何地进行反思性探索,在数学推理任务上展现出显著优势,比基线方法减少高达50%的标记使用量,同时提高了准确率。这一研究不仅解释了"为什么反思有用",还提供了实用的指导原则,为AI系统的自适应推理能力开辟了新方向。