Cloudera今天宣布预览了一个新的云原生机器学习平台,该平台运行在Kubernetes软件容器编排平台上。
容器是可移植的、自包含的软件环境,包括了代码和所有依存关系,让应用能够可靠地运行在多个计算环境中。
Cloudera表示,这个新推出的Cloudera Machine Learning平台将在异构计算环境中提供快速配置、自动扩展以及容器化分布式处理功能,旨在将安全数据访问与跨内部部署、公有云、混合环境中的统一体验相结合。安全数据访问覆盖Hadoop的HDFS文件系统、云对象存储和外部数据库。
此举代表着Cloudera正在逐渐摆脱对Hadoop大数据平台的依赖。随着Hadoop成为云中的一种商用服务,Cloudera已经开始向价值链上端移动,把机器学习作为自己的核心竞争力。
Cloudera表示,企业越来越需要将机器学习作为日常运营的一部分。Cloudera Machine Learing旨在帮助这些企业组织降低机器学习开发的门槛,让用户能够配置他们自己的环境而尽量减少IT部门人员的负担。
该软件扩展了本地Cloudera Data Science Workbench的工作流程元素,具有类似云的功能,如自动缩放、分布式依赖隔离以及分布式GPU训练,可以使用标准的Kubernetes工具安装到任何受支持的Kubernetes环境中,也就意味着它不依赖于主机处理器。依赖管理由容器化的Python、R和Apache Spark-on-Kubernetes库提供。
该产品最初针对的是那些希望使用公有云存储服务的企业组织,以及那些现有云管理Kubernetes环境的客户。Cloudera表示,计划未来将该产品作为托管服务提供给客户。Cloudera的Data Science Workbench将仍然是内部部署的首选平台。
Cloudera未公布定价,预计该产品明年上市。企业现在可以注册进行预览。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。