ZD至顶网软件频道消息:IBM周一宣布推出一款新的、由Watson支持的云服务,这次推出的这项服务计划分析视频元数据。National Association of Broadcasters Show(国家广播电视节目协会)宣布这项服务应该能够帮助内容提供商和广告商找到吸引目标受众的方式。
该服务将利用Watson的认知能力来提取元数据,例如关键字、概念、视觉图像、语气和情感语境。它使用一系列Watson API,包括:Tone Analyzer(语音分析器)、Personality Insights(个性洞察)、Natural Language Understanding(自然语言理解)和Visual Recognition(视觉识别)。它也可以将视频分割成逻辑场景。
例如,运动网络可以使用该服务来快速并自动地识别和打包用于广告中的篮球相关的快乐场景内容,而不是让人手动选择要使用的视频片段。
IBM表示,该公司人工智能提供的功能在视频分析市场上是独一无二的。该公司表示,鉴于通过各种设备在云端上传的内容越来越多,企业要想从中获取有用的见解正在变得更加困难。
IBM全球电信、媒体和娱乐行业的总经理Steve Canepa在一份声明中表示:“我们看到多屏幕内容和观看选项的巨大增长正在为M&E公司提供重要的需求,改变内容的开发和交付方式,以应对不断变化的观众行为。”
今年晚些时候提供的这项服务将以IBM以前对Watson可以为媒体和娱乐行业提供服务的研究为基础。去年,IBM利用Watson生产电影预告片,而今年早些时候,Watson技术则成为高尔夫球锦标赛的亮点。
好文章,需要你的鼓励
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
AWorld团队开发的Recon-Act系统采用"侦察-行动"双团队协作模式,通过工具中心的自我进化机制实现智能浏览器操作。系统在VisualWebArena测试中达到36.48%成功率,超越现有自动化方案。其创新性在于将信息收集与任务执行分离,通过对比成功失败案例自动生成专用工具,为未来智能浏览器助手发展提供了新思路。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
中科院团队提出QuantVGGT技术,首次解决大规模3D重建AI模型的部署难题。通过双重平滑精细量化和噪声过滤多样化采样两项核心技术,成功将12亿参数的VGGT模型压缩75%体积、提升2.5倍速度,同时保持98%原始性能。实验结果显示该方法在相机位置估计和点云地图生成任务上均显著优于现有量化技术,为3D AI技术的产业化普及提供了重要突破。