阿里用AI为视频加标签做分类准确率87.41%夺LSVC 2017冠军

近日，大规模视频分类比赛ACM MM LSVC公布了本年度最佳成绩，阿里巴巴iDST团队凭借平均准确率87.41%夺得冠军。

ACM MM是全球顶级的机器视觉会议，LSVC作为ACM MM的重要一部分，全称为Large-Scale Video Classification Challenge，主要考验参赛队伍在大规模视频分类算法方面的能力。

比赛数据集包含了来自Youtube的大约16万的视频，一共8000个小时。需要参赛队伍对视频中的500类内容做出识别，包含社会事件（如：橄榄球比赛）、物体（如：熊猫）、场景（如海滩）、动作（如：制作蛋糕）。

视频分类算法涉及到非常多的技术，包括视频帧特征提取（frame feature extraction）、视频帧特征集成（frame feature aggregation）、多模态的视频信息提取（视频画面、语音、物体运动、场景等模态）等方面。

iDST官网上的“视频标签预测”DEMO

阿里巴巴iDST团队采用了inception-resnet-v2 和 Squeeze-and-Excitation Networks 对视频帧特征进行提取，并且采用NetVLAD对提取到的视频帧特征进行集成。结合多模态信息的融合之后，单模型在验证集上的平均准确率达到了84.85%，融合多模型达到87.41%。

此外，大规模的视频处理能力也是比赛考验的重要方面。阿里巴巴iDST拥有一个强大的视频分析平台，可处理来自优酷土豆的百万量级的视频。这为高效地对LSVC数据集提取特征进行实验提供了帮助。

iDST官网上的“目标检测”DEMO

据阿里巴巴iDST视频算法高级专家刘扬介绍，这些视频分析算法目前已应用在包括优酷、土豆、UC、闲鱼等在内的多个业务中，有效改善了用户在视频搜索、推荐、编辑等方面的体验。“我们正在将这样的能力集成到阿里云ET上对外服务”。

作为阿里巴巴对外技术输出的窗口，阿里云目前提供了从计算能力、开发框架、基础AI能力到行业全局智能在内的整套服务。

iDST全称Institute of Data Science & Technologies，是阿里巴巴内部的尖端研究机构，专注于AI领域的前沿性研究。由金榕、任小枫、华先胜、司罗等知名科学家领导。在ACM MM中，阿里巴巴亦有三篇论文入选。

来源：业界供稿

阿里云

0赞

好文章，需要你的鼓励

阿里用AI为视频加标签做分类 准确率87.41%夺LSVC 2017冠军

来源：业界供稿

2017

09/29

18:21

分享

点赞

MCP难以满足合规要求：受监管行业对开放智能体交换持谨慎态度

IBM推出基于定制Power11处理器的新服务器系列

选择飞书，就是选择企业长期值得信赖的AI伙伴

超七成家长称学校未教授编程课程

新型AI模型的深度研究功能及其应用探索

日本浮动数据中心船舶项目将于2027年投入运营

2025年已诞生至少36家新晋科技独角兽企业

突破AI存储瓶颈，大幅提升边缘推理性能

Google默认启用Gemini访问第三方应用功能引发隐私担忧

AGI和AI超智能被盗是一个极具诱惑的选择

F5携手NVIDIA全面增强AI时代的性能、多租户与安全能力

Gartner：到2030年，80%企业软件和应用将为多模态，2024年尚不足10%

AI时代的“摆渡人”：从云起到智深，源信网络的七年穿越

凌云创想的AI创新加速计划

阿里云刘伟光： 阿里云将全力服务生而全球的企业

全球领头CRM，如何在中国跑出新模式？

打造“全球一朵云”，广汽迈入出海3.0时代

阿里云：以战略级投入，全力支持中国企业出海

阿里云GraphScope Flex登顶权威榜单，每秒处理超8万次请求

阿里云弹性计算十五周年发布第九代Intel实例，重新定义企业级计算“新标杆”

阿里云如何让“创新扩散”，做中国企业出海的隐形推手？

阿里云李飞飞：将大模型，装进数据库里

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

阿里用AI为视频加标签做分类准确率87.41%夺LSVC 2017冠军

阿里云刘伟光：阿里云将全力服务生而全球的企业