至顶网软件与服务频道消息:ACM(国际计算机学会)刚刚公布2019年度杰出科学家名单,全球共有62名研究人员入选。阿里巴巴集团有两位科学家上榜,他们是达摩院语言技术实验室负责人司罗和蚂蚁金服研究员Alex Liu。
创立于1947 年的ACM是全球最大的计算机领域专业性学术组织,拥有超过10万名会员,著名的图灵奖就是由其设立。ACM 杰出会员评选始于2006 年,意在表彰拥有15 年以上专业经验,并在计算机领域做出杰出贡献的ACM 会员。
司罗,卡内基梅隆大学博士,曾任普渡大学计算机系终身教授,现任阿里巴巴达摩院语言技术实验室负责人。专注于自然语言处理、机器学习、深度学习等人工智能基础技术研究。获得过美国国家科学基金会成就奖、谷歌研究奖等,发表过150余篇学术论文,先后担任ACM信息系统、ACM 交互信息系统和信息处理与管理编委会副主编。
阿里巴巴人工智能每天调用自然语言5千亿句,司罗团队构建的自然语言处理技术体系提供了主要支持。司罗团队曾在机器阅读理解顶级赛事SQuAD中实现机器精确阅读率超越人类的突破,在国际顶级机器翻译大赛WMT中包揽五项第一。
(蚂蚁金服平台数据技术事业群研究员Alex Liu)
Alex Liu,IEEE Fellow,曾任美国密歇根州立大学教授,现任蚂蚁金服平台数据技术事业群研究员,专注金融领域的网络安全与隐私保护研究。
近年来,蚂蚁金服在科研人才和前沿技术研究方面持续投入,在国际顶会发表数十篇论文,与国内外多个高校和学术界领军人物展开科研合作。目前已在可信执行环境、多方安全计算、共享智能等前沿技术上取得突破,并在生产环境成功落地,为金融级基础设施保驾护航。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。