至顶网软件与服务频道消息: 2017年谷歌的几位工程师和其他几位科技公司同行开源了Kubeflow。Kubeflow是一个工具包,让企业组织可以在基于容器编排框架Kubernetes的基础设施上部署AI工作负载。
Kubeflow 1.0版本引入了该软件几个核心组件,这些组件“定义的稳定性、可支持性和可升级性”都是符合企业用户需求的,也就是说,现在这个工具包作为一个整体可投入生产使用。
Kubeflow 1.0带来了内置管理控制台的稳定版本,其中包含关键功能的快捷方式。功能之一是Jupyter Notebook控制器,现在已经升级到稳定状态,可以让AI团队使用Jupyter Notebook开发工具创建新的机器学习模型。
该模型就绪之后,用户就可以使用TensorFlow或PyTorch对其进行训练。Kubeflow 1.0支持TFJob和PyTorch Operator,这两者让开发人员可以使用他们选择的框架和相对简单的脚本来设置AI训练工作流。
今天公布的版本还有一些面向管理员的功能,这些管理员主要管理开发者构建AI工作负载所使用的基础设施。此外还有kfctl,它可以在云环境中自动部署Kubeflow,以及可以在各个开发人员之间分配环境资源的控件。
谷歌开源策略师Thea Lamkin在博客文章中详细介绍称:“有了Kubeflow,每个数据科学家或者团队都可以得到一个命名空间,可以在其中运行工作负载。命名空间提供了安全性和资源隔离。平台管理员使用Kubernetes资源配额可以轻松限制个人或者团队消耗多少资源,以确保公平调度。”
Google Cloud工程师Jeremy Lewi和Abhishek Gupta在另一篇文章中写道,企业可以在谷歌Anthos应用平台上部署Kubeflow 1.0以获得这些新功能。展望未来,谷歌计划加强对AI工具包的支持。谷歌将允许企业在本地Anthos部署上设置Kubeflow,并与Google Cloud的网络安全功能进行更紧密的集成。
好文章,需要你的鼓励
TPU与GPU之间的竞争正在重塑AI硬件市场格局。GPU基于并行处理,能处理多样化任务,而TPU专门针对张量矩阵运算进行优化。谷歌TPU采用类似RISC的设计理念,通过限制功能来提升特定运算效率。随着Meta计划在2027年采购数十亿美元的TPU芯片,Anthropic宣布使用百万TPU训练Claude模型,TPU生态系统正在获得发展动力,对英伟达的GPU霸主地位构成挑战。
Meta与华盛顿大学联合研究团队开发出无需人类标注的AI评判官自我训练框架。该方法通过生成合成对比数据、自我判断筛选和反复学习,使110亿参数的AI评判官在多项视觉语言任务中超越GPT-4o等大型模型,成本仅为传统方法的1%,为AI自主学习和评估开辟新路径。
本文提出2026年AI发展十大预测,包括AI估值修正、投资泡沫持续、AGI不仅依赖大语言模型、AI代理将加剧工作替代等。作者强调社会接受度对技术发展的重要性,认为成功企业将重构运营模式以AI为核心,同时指出政府仍将重视STEM教育而忽视社会科学的价值。
华中科技大学团队开发出4DLangVGGT技术,首次实现AI系统对4D动态场景的语言理解。该技术突破传统方法需要逐场景训练的限制,能跨场景通用部署。系统结合几何感知和语义理解,不仅能识别物体还能描述其时间变化过程。实验显示在多项指标上超越现有方法1-2%,为机器人、AR/VR、智能监控等领域提供重要技术支撑。