Cloudera今天宣布预览了一个新的云原生机器学习平台,该平台运行在Kubernetes软件容器编排平台上。
容器是可移植的、自包含的软件环境,包括了代码和所有依存关系,让应用能够可靠地运行在多个计算环境中。
Cloudera表示,这个新推出的Cloudera Machine Learning平台将在异构计算环境中提供快速配置、自动扩展以及容器化分布式处理功能,旨在将安全数据访问与跨内部部署、公有云、混合环境中的统一体验相结合。安全数据访问覆盖Hadoop的HDFS文件系统、云对象存储和外部数据库。
此举代表着Cloudera正在逐渐摆脱对Hadoop大数据平台的依赖。随着Hadoop成为云中的一种商用服务,Cloudera已经开始向价值链上端移动,把机器学习作为自己的核心竞争力。
Cloudera表示,企业越来越需要将机器学习作为日常运营的一部分。Cloudera Machine Learing旨在帮助这些企业组织降低机器学习开发的门槛,让用户能够配置他们自己的环境而尽量减少IT部门人员的负担。
该软件扩展了本地Cloudera Data Science Workbench的工作流程元素,具有类似云的功能,如自动缩放、分布式依赖隔离以及分布式GPU训练,可以使用标准的Kubernetes工具安装到任何受支持的Kubernetes环境中,也就意味着它不依赖于主机处理器。依赖管理由容器化的Python、R和Apache Spark-on-Kubernetes库提供。
该产品最初针对的是那些希望使用公有云存储服务的企业组织,以及那些现有云管理Kubernetes环境的客户。Cloudera表示,计划未来将该产品作为托管服务提供给客户。Cloudera的Data Science Workbench将仍然是内部部署的首选平台。
Cloudera未公布定价,预计该产品明年上市。企业现在可以注册进行预览。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。