至顶网软件频道消息: 6月10日,阿里云在云栖大会·上海峰会上宣布,将在印度和印度尼西亚新建数据中心,为海内外企业提供更加便捷的全球一张网云计算服务。目前,阿里云拥有亚洲规模最大的计算资源平台,未来新增的印度、印尼和马来西亚数据中心,将把阿里云全球覆盖面提高至由数十个飞天数据中心覆盖的17个区域。
大会上,印度电信巨头塔塔通信与阿里云宣布达成合作。此前,另一印度科技巨头信实电信也宣布成为阿里云的合作伙伴。在印尼,当地最大的票务服务商Ezytravel、社交媒体Yogrt、短视频Vshow等新兴的互联网科技公司也正在使用阿里云的服务。
有分析人士认为,东南亚和南亚拥有基数庞大的年轻人口,区域市场跨过Web时代直接进入移动互联网市场,大量创业公司复制中国互联网模式在当地迅速崛起,“但复制不了互联网核心技术,急需互联网基础设施服务进入当地市场。”
在大会现场,阿里云总裁胡晓明表示,中国自主研发的飞天技术伴随阿里云的全球布局走向海外市场,为当地急速发展的科技产业提供新技术,同时也为中国企业出海修好“普惠道路”,为各个区域的经济和技术发展提供技术纽带。
据了解,阿里云目前在美国西部、美国东部、澳大利亚、日本、新加坡、迪拜、德国、香港等14个区域设有数十个飞天数据中心,形成全球“日不落”覆盖。不久前,阿里云宣布将在马来西亚新家数据中心。马来西亚总理纳吉布到访阿里巴巴时,曾特别点赞来自中国的新技术,为当地经济增长提供新动能。
阿里云飞天研发负责人李津在大会现场表示,阿里云人工智能、网络安全、企业级互联网架构等世界领先的技术和产品将伴随数据中心布局走向全球。
在国际市场上,人工智能、网络安全和企业级互联网架构已成为阿里云与亚马逊、微软等国际科技公司的竞争优势。在人工智能领域,阿里云提供了丰富的产品类型,覆盖从机器学习平台、敏捷BI到可视化的丰富产品和服务。
凭借领先的技术和产品,阿里云在国际市场近一年来的规模增速超过400%,同时带动超过十万家中国企业规模化出海。在即将开服的印度和印尼市场上,已有大量来自这两个区域市场的用户在使用阿里云的服务。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。