9月25日,阿里云智能总裁张建锋在2019杭州云栖大会主题演讲中表示:云、大数据、智联网、移动协同等已经成为数字经济的四大关键技术,支撑数字经济的伟大进程,是阿里云的使命和要解决的核心问题。
张建锋表示,从需求到生产,从供应到运营,数字经济需要全要素的数字化升级和创新,而这一切背后都需要现代信息技术驱动。“过去几千年,整个社会没有大变化,是因为没有新技术。今天我们可以畅想数字经济,就是因为有现代化的信息技术。”张建锋说。
张建锋认为,可靠易用的云、全局智能的大数据、云端一体的智联网、随时随地的移动协同成为数字经济的四大关键技术。他还举例说,目前这四大关键技术正支撑政务服务、城市治理、农业、医疗等多领域的数字化转型。
过去20年阿里巴巴一直都是数字经济技术的坚定实践者、推动者、创新者和赋能者。“今天外面有非常多的云计算,非常多的大脑,还有非常多的中台,无一例外,阿里巴巴都是这些创新的发源地。”张建锋说,支撑数字经济的伟大进程,是阿里云的使命和要解决的核心问题。
阿里巴巴自主研发的飞天操作系统开创了中国云时代,是中国唯一真正能够调度单集群超过10万台服务器的系统。通过成立达摩院,在机器智能、区块链、量子计算、自动驾驶等基础性技术领域进行深度布局。
另外在大会上,张建锋还发布了平头哥半导体的首款AI推理芯片含光800,并宣布基于含光800芯片的AI云服务正式通过阿里云对外输出,为客户提供最具性价比的解决方案。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。