IBM和MIT在视频识别模型训练方面取得最新突破

IBM已经与麻省理工学院的研究人员合作开发了一种新方法，可以更有效地训练“视频识别”深度学习模型。

至顶网软件与服务频道消息：IBM已经与麻省理工学院的研究人员合作开发了一种新方法，可以更有效地训练“视频识别”深度学习模型。

深度学习是机器学习的一个分支，旨在复制人脑解决问题的方式，已经在语言翻译、图像和语音识别等领域引发了重大颠覆。

视频识别类似于图像分类，深度学习模型会尝试识别视频中的一切，包括所看到的对象和人物，他们在做什么等等。两者之间的主要区别在于，视频相比简单的静态图像具有更多的运动部分，因此训练深度学习模型来理解视频内容要花费更多的时间和精力。

麻省理工学院在今天的一篇博客文章中解释说：“据估计，训练视频识别模型所需要的数据比训练图像分类模型最多可多出50倍，处理能力则是其8倍。”

当然，没有人喜欢为这种任务投入大量的计算资源，因为成本是极高的。此外，这种任务对资源的要求，使其几乎无法在低功率移动设备上运行视频识别模型。

这些问题促使麻省理工学院电气工程与计算机科学系助理教授Song Han领导的研究团队提出了一种更为有效的视频识别训练模型，这项新技术极大地减少了视频识别模型的大小，从而缩短了训练时间并提高了移动设备的性能。

“我们的目标是让使用低功耗设备的任何人都可以使用AI。要做到这一点，我们就需要设计出一种高效的AI模型，这种模型能耗低，且可以在边缘设备上平稳运行。”

图像分类模型通过在图像像素中查找图案来建立工作模式，以构建它们看到的内容呈现。在有足够示例的情况下，该模型可以学习识别人、物体及其之间的关联方式。

视频识别的方式类似，但是深度学习模型更进了一步，使用“三维卷积”在一系列图像（视频帧）编码时间，从而使得模型更大、计算更密集。为了减少计算量，Han和他的同事设计出了一种“时间偏移模块”，该模块将选定视频帧的特征映像移动到相邻的帧，通过混合过去、现在和未来的空间呈现，模型无需明确呈现即可实现时间流逝感。

这项新技术让基于Something-Something视频数据集（一系列密集标记的视频剪辑集合，呈现了人类对日常事务执行所预设的基本动作）的模型训练速度比现有模型快了3倍。

该模型甚至可以实时理解人们的动作，并且能耗很低，例如该模型让摄像头上安装的单板计算机立即对手势进行分类，能耗相当于自行车灯的电量。

Constellation Research首席分析师、副总裁Holger Mueller表示，机器学习仍处于发展早期阶段，采用这种创新方法所能获得的收益也是如此。“今天MIT和IBM合作加速视频识别技术的发展，而这正是目前难度最大的机器学习任务之一。”

IBM和MIT表示，这种新的视频识别模型可以在运用于各个领域，例如可以加快在YouTube或类似服务上分类视频的速度，还可以使医院在本地而不是在云中运行AI应用，从而使机密数据更安全。

来源：siliconANGLE

0赞

好文章，需要你的鼓励

IBM和MIT在视频识别模型训练方面取得最新突破

来源：siliconANGLE

2019

10/10

23:15

分享

点赞

名企齐聚！阿里云携手牧原、UU跑腿、新开普等豫企共绘数智未来

SIGGRAPH｜NVIDIA物理AI“全景”更新！

阿里团队推出DeepPHY：首个专门测试AI视觉模型物理推理能力的综合评估平台

微软8月补丁修复8个关键远程代码执行漏洞

Google Photos经典搜索功能快速恢复方法：替代Ask Photos生成式AI搜索

Dell PowerProtect全面升级，助力企业强化网络韧性与恢复能力

2025世界机器人大会在京圆满闭幕

SiMa.ai发布新一代物理AI系统级芯片正式投产

Ai2发布开源AI模型，让机器人在3D空间"规划"动作

曾经的小型研究实验室如何助力英伟达成为万亿美元公司

Debian 13 "Trixie"正式发布：停止支持x86-32，新增RISC-V架构

VS Code发布聊天检查点功能预防AI对话失误

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: