9月25日,阿里云智能总裁张建锋在2019杭州云栖大会主题演讲中表示:云、大数据、智联网、移动协同等已经成为数字经济的四大关键技术,支撑数字经济的伟大进程,是阿里云的使命和要解决的核心问题。
张建锋表示,从需求到生产,从供应到运营,数字经济需要全要素的数字化升级和创新,而这一切背后都需要现代信息技术驱动。“过去几千年,整个社会没有大变化,是因为没有新技术。今天我们可以畅想数字经济,就是因为有现代化的信息技术。”张建锋说。
张建锋认为,可靠易用的云、全局智能的大数据、云端一体的智联网、随时随地的移动协同成为数字经济的四大关键技术。他还举例说,目前这四大关键技术正支撑政务服务、城市治理、农业、医疗等多领域的数字化转型。
过去20年阿里巴巴一直都是数字经济技术的坚定实践者、推动者、创新者和赋能者。“今天外面有非常多的云计算,非常多的大脑,还有非常多的中台,无一例外,阿里巴巴都是这些创新的发源地。”张建锋说,支撑数字经济的伟大进程,是阿里云的使命和要解决的核心问题。
阿里巴巴自主研发的飞天操作系统开创了中国云时代,是中国唯一真正能够调度单集群超过10万台服务器的系统。通过成立达摩院,在机器智能、区块链、量子计算、自动驾驶等基础性技术领域进行深度布局。
另外在大会上,张建锋还发布了平头哥半导体的首款AI推理芯片含光800,并宣布基于含光800芯片的AI云服务正式通过阿里云对外输出,为客户提供最具性价比的解决方案。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。