Nvidia 正在更新其 Windows 平台上的 G-Assist AI 助手,将其功能从优化游戏和系统设置扩展到更多应用。G-Assist 上个月作为主要致力于提升 PC 游戏体验的聊天机器人首次推出,而如今它加入了插件支持,让你可以让这个 AI 助手控制 Spotify、检查 Twitch 上某个主播是否正在直播,以及查看股票或天气更新。
全新基于 ChatGPT 的 G-Assist 插件构建器允许开发者和爱好者为 Nvidia 的 AI 助手创建自定义功能。G-Assist 将能够连接到外部工具并使用 API 来扩展目前 Nvidia 提供的功能。
Nvidia 已在 GitHub 上发布了示例插件,供编译后由 G-Assist 使用:
Spotify — 免提音乐播放和音量控制
Google Gemini — 允许 G-Assist 调用 Gemini 进行云端复杂对话
Twitch — 你可以使用此插件通过语音命令检查某位主播是否正在直播,例如命令:“嘿, Twitch, [主播] 正在直播吗?”
外围设备控制 — 调整 Logitech G、Corsair、MSI 和 Nanoleaf 设备的 RGB 灯光或风扇速度
股票查询 — 提供实时股票价格
天气更新 — 提供任意城市的当前天气状况
这些插件全部在本地运行,借助 Nvidia RTX GPU 上的小型语言模型,同时开发者还可以通过 GitHub 分享他们自己定制的插件。G-Assist 使用的本地小型语言模型需要近 10GB 空间来支持其助手功能和语音能力。该 AI 助手适用于多种 RTX 30、40 和 50 系列桌面 GPU,但你需要至少一块拥有 12GB VRAM 的显卡。
如果你有兴趣试用 G-Assist 或构建插件,该应用作为 Nvidia Windows 主应用的一个可选组件提供。
好文章,需要你的鼓励
Jabra 推出 PanaCast 40 VBS:首款专为小会议室设计的 180° Android 智能音视频一体机
这是一项关于计算机视觉技术突破的研究,由多家知名院校联合完成。研究团队开发了LINO-UniPS系统,能让计算机像人眼一样从不同光照下的照片中准确识别物体真实的表面细节,解决了传统方法只能在特定光照条件下工作的局限性,为虚拟现实、文物保护、工业检测等领域带来重要应用前景。
字节跳动智能创作实验室发布革命性AI视频数据集Phantom-Data,解决视频生成中的"复制粘贴"问题。该数据集包含100万个跨场景身份一致配对,通过三阶段构建流程实现主体检测、多元化检索和身份验证,显著提升文本遵循能力和视频质量。
这篇文章介绍了北京人工智能研究院开发的OmniGen2模型,一个能够同时处理文字转图像、图像编辑和情境生成的全能AI系统。该模型采用双轨制架构,分别处理文本和图像任务,并具备独特的自我反思机制,能够自动检查和改进生成结果。研究团队还开发了专门的数据构建流程和OmniContext评测基准,展现了开源模型的强大潜力。