至顶网软件与服务频道消息:科技无国界、学术无边界,阿里巴巴发起的全球性科研合作计划AIR(Alibaba Innovative Research,阿里巴巴创新研究计划)启动2020年项目征集。AIR计划实施三年,已吸引全球100多所高校,开展500多项学术合作,产生学术论文300多篇、国际竞赛冠军30多项。
协同合作是当今前沿科技研究的重要路径,为与全球顶尖高校及科研机构开展协同创新,阿里巴巴于2017年发起AIR计划,通过提供研究资金、业务场景及其他必要的支持,让学者与一线工程师共同开展计算机科学及相关领域探索,共同发现问题、定义问题、解决问题。
截至目前,海内外共有100多所顶尖高校和科研院所参与AIR计划。全球Top100高校有近30所成为阿里的合作伙伴,包括普林斯顿大学、剑桥大学、麻省理工学院、帝国理工大学、苏黎世联邦理工学院、多伦多大学等;国内“985”高校也有六成以上与阿里建立合作,来自“985”高校的合作项目占立项总量的80%以上。此外,AIR计划还凝聚了众多国际学术大牛,包括10多位IEEE Fellow和TR35荣誉获得者。
学界与工程界的共创催生了可观的学术成果,AIR计划已产出论文300多篇,并在国际竞赛上获得30多项冠军。不少论文被国际顶级学术会议收录,比如浙江大学孙建伶团队与阿里云数据库产品事业部团队合作的“基于FPGA加速的下一代存储引擎”研究,论文被存储行业顶级学术会议FAST录用。
阿里巴巴开放了经济体全场景资源,包括电子商务、新零售、城市大脑、金融支付、智能家居、智慧医疗、无人驾驶、工业大脑、云计算和数据中心等等。经过场景验证和实战锤炼,一些突破性技术在实际应用中落地,比如香港中文大学郑尚策教授团队与阿里云计算平台事业部团队合作的多集群数据和计算调度算法,已经通过专有云输出浙江政务云、国家电网等阿里云用户。
阿里巴巴表示,今年对外开放的合作领域包括量子技术、存储、安全、芯片、深度学习、人机交互等12个,将继续通过打造学术共同体推动全球科技创新。
近年来,阿里在基础科研上持续发力,从十多年前自研云计算,到创立达摩院、平头哥探索前沿技术,再到面向数学爱好者举办全球数学竞赛、创设青橙奖奖励青年科学家等,基础科研成为阿里科技大爆发的基石,包括AIR计划在内的学术合作是阿里科技进步的一股源头活水。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。