至顶网软件与服务频道消息:近日,斯坦福大学公布了最新的DAWNBench深度学习榜单,阿里云打破谷歌等企业创造的纪录,包揽图像识别比赛的四项第一,这也意味着阿里云可提供全球最快的AI计算服务。
斯坦福大学DAWNBench是人工智能领域最权威的竞赛之一,它是衡量深度学习优化策略、模型架构、软件框架、云和硬件等综合解决方案实力的标准之一。在图像识别(Image Classification on ImageNet)榜单中,阿里云包揽了训练时间、训练成本、推理延迟以及推理成本四项第一,打破了谷歌等企业保持一年多的纪录。
(阿里云包揽训练时间、训练成本、推理延迟以及推理成本四项第一)
DAWNBench官方显示,阿里云异构计算服务训练ImageNet 128万张图片仅需2分38秒,基于含光800的AI服务识别一张图片仅需0.0739ms,同时在训练成本和推理成本上也实现世界纪录的突破。
据悉,此次阿里云创造四项纪录得益于阿里云自研加速框架AIACC及平头哥含光800。AIACC是阿里云自主研发的飞天AI加速引擎,首次实现了统一加速Tensorflow、PyTorch、MxNet和Caffe等主流深度学习框架,在相同的硬件平台下,AIACC能够显著提升人工智能训练与推理的性能。
含光800是阿里巴巴第一颗自研芯片,也是全球性能最强的AI推理芯片,性能及能效比全球第一,基于含光800的AI云服务每秒可实现1600万亿次级别深度学习计算。
近年来,深度学习模型越来越复杂,所需的计算资源和计算时间也大幅增加,昂贵的AI算力制约了AI应用的落地,提升性能、降低成本成为企业的重中之重。
阿里云计算平台通过软硬件协同创新实现了性能上的大幅提升,目前相关AI计算服务已经在图像识别、语音识别、内容推荐、自动驾驶、自然语言理解等人工智能场景得到了大规模应用。以国内AI创业公司地平线为例,该公司采用阿里云AI计算服务进行深度学习训练,性能提升3倍,并显著降低训练成本。
据了解,阿里云已开源了基于AIACC加速引擎的AI解决方案,基于含光800的AI云服务也将对外开放。
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。