Cloudera今天宣布预览了一个新的云原生机器学习平台,该平台运行在Kubernetes软件容器编排平台上。
容器是可移植的、自包含的软件环境,包括了代码和所有依存关系,让应用能够可靠地运行在多个计算环境中。
Cloudera表示,这个新推出的Cloudera Machine Learning平台将在异构计算环境中提供快速配置、自动扩展以及容器化分布式处理功能,旨在将安全数据访问与跨内部部署、公有云、混合环境中的统一体验相结合。安全数据访问覆盖Hadoop的HDFS文件系统、云对象存储和外部数据库。
此举代表着Cloudera正在逐渐摆脱对Hadoop大数据平台的依赖。随着Hadoop成为云中的一种商用服务,Cloudera已经开始向价值链上端移动,把机器学习作为自己的核心竞争力。
Cloudera表示,企业越来越需要将机器学习作为日常运营的一部分。Cloudera Machine Learing旨在帮助这些企业组织降低机器学习开发的门槛,让用户能够配置他们自己的环境而尽量减少IT部门人员的负担。
该软件扩展了本地Cloudera Data Science Workbench的工作流程元素,具有类似云的功能,如自动缩放、分布式依赖隔离以及分布式GPU训练,可以使用标准的Kubernetes工具安装到任何受支持的Kubernetes环境中,也就意味着它不依赖于主机处理器。依赖管理由容器化的Python、R和Apache Spark-on-Kubernetes库提供。
该产品最初针对的是那些希望使用公有云存储服务的企业组织,以及那些现有云管理Kubernetes环境的客户。Cloudera表示,计划未来将该产品作为托管服务提供给客户。Cloudera的Data Science Workbench将仍然是内部部署的首选平台。
Cloudera未公布定价,预计该产品明年上市。企业现在可以注册进行预览。
好文章,需要你的鼓励
前OpenAI首席技术官Mira Murati创办的AI初创公司Thinking Machines Lab宣布推出"交互模型"技术。不同于现有AI的轮流对话方式,该模型采用"全双工"技术,能在接收输入的同时生成响应,实现类似真实电话通话的自然交互。其模型TML-Interaction-Small响应速度达0.40秒,优于OpenAI和谷歌同类产品。目前仍处于研究预览阶段,计划数月内开放有限测试,年内正式发布。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
澳大利亚各州及联邦能源部长在近期会议上达成共识,要求数据中心通过投资新建可再生能源和储能设施,完全抵消其电力需求。除昆士兰州外,所有州均支持该提议。联邦能源部长克里斯·鲍文表示,数据中心是新增能源需求的最大驱动力之一,应成为电网的助力而非负担。澳大利亚能源市场委员会将于7月前提交具体实施建议。数据显示,到2030年数据中心用电量预计将增至现在的三倍。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。