9月26日,阿里巴巴在杭州云栖大会上首次公布人工智能调用规模:每天调用超1万亿次,服务全球10亿人,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句,已经成为中国最大的人工智能公司。
同时,阿里巴巴首次披露人工智能的完整布局,在AI芯片、AI云服务、AI算法、AI平台、产业AI实现全线领先。
在AI芯片层,平头哥发布全球最强AI芯片含光800,打破业界纪录,性能及能效比全球第一,1块含光800算力就相当于10块GPU。目前已应用于阿里巴巴多个场景,如支持拍立淘索引时间从1小时缩短至5分钟。
在AI云服务层,全球前三、亚太第一的阿里云已构建起亚洲种类最全、规模最大的人工智能集群,包括GPU、FPGA、NPU、CPU、超算集群、第三代神龙架构等在内的公共云服务共同形成面向人工智能产业的最强力支持。日前为某现象级APP调集近万片GPU,创下世界记录。
在AI平台层,飞天AI平台、飞天大数据平台、AIoT平台等大大降低AI开发门槛。其中,飞天AI平台是国内首个云端商业化机器学习平台,支持上百亿特征、千亿训练样本的超大规模经典算法,降低35%训练成本、多个场景下提升400%训练速度,还首创公共云上可视化建模,为开发者提供了接近本地开发的极致体验。
在AI算法层,达摩院成立两年来在自然语言处理、智能语音、视觉计算等领域夺得40多项世界第一。其中自然语言处理在SQuAD机器阅读评比中精确阅读率首次超过人类,智能语音入选MIT Technology Review 2019年“全球十大突破性技术”,电话语音客服机器人被认为是“比谷歌更好的语音技术”,视觉计算可识别超过100万种物理实体。
阿里巴巴的人工智能既对内实践,也对外服务。
内部实践中,阿里小蜜每天服务在线及热线用户超500万人次,覆盖全球132个国家和地区的11种语言;天猫精灵是全球最大的中文智能助手,总销量超过2000万台。自动驾驶正从单车智能向车路协同方向进化,2018年获杭州政府颁发的首张无人驾驶路测牌照“浙A4390试”。
对外服务则最早实践产业AI,2015年率先推进互联网技术与传统产业的融合,联合合作伙伴推进产业落地。以城市大脑为代表的产业AI正广泛应用于全产业场景。目前杭州、海口、北京、上海、拉萨、澳门、吉隆坡等23个城市已先后引入城市大脑。
阿里巴巴达摩院机器智能实验室主任金榕表示,阿里巴巴人工智能在技术布局、产业落地上已经形成了独一无二的良性循环,真正把商业机会与科技优势紧密联系。
与此同时,阿里巴巴大力招募人才、重资研发投入。已拥有10多位IEEE FELLOW、30多位知名高校教授、30位国家/省级千人称号专家,先后在国际顶级学术会议上发表450多篇论文,
阿里还在持续加大研发投入。在全球知名科技公司中,阿里巴巴是唯一一家研发人员占一半以上的公司,据普华永道调研数据显示,阿里巴巴的研发投入已经连续三年位列中国上市企业第一。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。