4月26日,大数据领域权威竞赛TPC-DS公布了最新结果,阿里云作为全球唯一入选的云计算公司获得第一。值得一提的是,去年阿里云EMR首次打破该竞赛纪录,成为全球首个通过TPC认证的公共云产品。今年在这一基础上,EMR的计算速度提升了2.2倍,连续两年打破了这项大数据领域最难竞赛的世界纪录。
阿里云EMR成绩连续两年位居TPC-DS第一
TPC-DS是大数据领域门槛最高的竞赛,也是评估大数据计算产品性能的权威标准之一。其需要参赛企业在十几秒内时间内完成极高复杂度的SQL查询以及超大规模数据量的计算处理,这对大数据计算产品的计算性能要求极高,过去十几年,顶级科技企业都在尝试冲击榜单,但至今仅有两家公司的大数据软件通过认证,其中之一就是阿里云。
过去一年,阿里云EMR在原有开源技术架构之上,自研JindoFS等创新技术,在国内率先解决了计算、存储分离架构下的性能损耗问题,可满足大规模计算场景的性能需求。
目前,EMR已服务新零售、互联网、教育、人工智能及政务等行业企业和机构,以国际知名营销服务公司Yeahmobi为例,该公司通过使用阿里云EMR构建大数据计算平台,实现了统一存储、统一分析,整体成本下降超30%。
过去十年,阿里云大数据计算产品打破了多项世界纪录,2015、2016年,自研MaxCompute刷新世界计算奥运会SortBenchmark的六项世界纪录;2017年,MaxCompute完成全球首次基于公共云的100TB BigBench大数据基准测试;2019年MaxCompute以100TB的数据规模创造TPCx-BB竞赛世界纪录。
阿里云计算平台事业群总裁贾扬清表示,“阿里云积极拥抱开源技术的同时,也在不断投入自研创新技术,此次阿里云连续两年刷新世界纪录,是多年自研技术的必然成果,阿里云希望用这些创新技术服务更多的企业。”
好文章,需要你的鼓励
Converge Bio完成550万美元种子轮融资,由TLV Partners领投。该公司专为生物科技和制药行业打造LLM应用平台,提供数据增强、模型微调及可解释性分析等功能,帮助企业将通用生物基础模型转化为可实际落地的研发工具。以抗体研究为例,平台可将抗体LLM精调至氨基酸级别的结合亲和力预测,并生成优化序列。公司计划用于扩充团队、拓展客户,并发布抗体设计科研论文。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
ChatGPT高级语音模式的创造者Alexis Conneau离开OpenAI后,创办了音频AI初创公司WaveForms AI,并获得由a16z领投的4000万美元种子轮融资。该公司专注于训练自有音频大语言模型,计划于2025年推出与OpenAI、谷歌竞争的AI音频产品。Conneau深受电影《Her》启发,致力于开发具备情感感知能力的语音AI,同时警惕AI伴侣化带来的社会问题,强调技术应服务于人而非取代人际关系。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。