至顶网软件频道消息:麻省理工学院计算机科学与人工智能实验室的一个研究人员团队开发了一种名为Pensieve的人工智能,可以使缓慢或模糊的网络视频成为过去。
流媒体视频内容近年来一直在跨越式发展,但不幸的是它的带宽要求也呈现出跨越式的跃升。为了克服这个挑战,像YouTube或Netflix这样的视频平台使用了将视频分成更容易处理的块的算法。如果他们的系统检测到您的互联网速度减慢,下一个视频片段将以较低的分辨率播放,用这种方式努力追上播放进度。
该系统背后的思路是确保顺畅的视频播放,但有时即使是质量下降,视频仍然会暂停几秒钟,因为它试图缓冲下一个块。这是因为算法并不总是准确地预测下一个块应该使用什么分辨率。
这正是Pensieve的用武之地。麻省理工学院的研究人员使用一种奖励和惩罚系统来开发它,训练它来识别有效的缓冲技术。例如,只要成功播放完整的视频而不必重新缓存,Pensieve就可以得到奖励,如果视频质量低于某个阈值,它则可能会受到惩罚。
博士生Hongzi Mao是这篇描述了Pensieve流程和功能论文的主要作者,他表示,“通过查看过去实际的表现,它学习到不同的策略如何影响性能,它可以以更加强硬的方式改进其决策策略。”
根据研究小组的论文,Pensieve可以将视频流量比其他系统多减少10%至30%,用户将其“体验质量”评价为提高了10%至20%。
Mao表示,Pensieve具有足够的灵活性以适应不同的要求。例如,可以对其进行培训,可以以牺牲分辨率为代价保障视频连续播放,或者也可以进行相反的训练,让质量的优先级高于顺畅。
研究团队的下一个项目将是测试Pensieve在流媒体虚拟现实内容中的有效性,它需要高得多的带宽,并且对低质量的容忍度要低得多。
麻省理工学院的教授Mohammad Alizadeh(Mohammad Alizadeh)是Pensieve上这篇论文的一位合著者,他表示:“你需要的4K质量的VR可以轻松地达到每秒数百兆比特的速度,今天的网络根本无法支持”。他表示,“我们很高兴看到像Pensieve这样的系统能够为VR等技术所做的一切。这还只是第一步。”
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。