肯睿Cloudera发布附带嵌入式NVIDIA NIM微服务的AI推理服务

2024年10月9日，可信的数据、分析和AI混合平台厂商肯睿Cloudera今天发布了由NVIDIA NIM微服务驱动的肯睿Cloudera AI推理服务，该服务同时成为NVIDIA AI Enterprise平台的一部分。

2024年10月9日，可信的数据、分析和AI混合平台厂商肯睿Cloudera今天发布了由NVIDIA NIM微服务驱动的肯睿Cloudera AI推理服务，该服务同时成为NVIDIA AI Enterprise平台的一部分。作为业界首批提供嵌入式 NIM微服务功能的AI推理服务之一，肯睿Cloudera AI推理服务以独特方式简化了大规模AI模型的部署与管理，使企业能够发挥出其数据的真正潜力，将生成式AI从试点阶段推进到全面生产阶段。

根据德勤最新数据显示，企业采用生成式AI的最大障碍是合规风险和治理问题。尽管如此，生成式AI仍在快速普及，今年第三季度有超过三分之二的企业增加了生成式AI预算。为了缓解上述问题，无论在本地，还是在公有云中，企业都必须转向私有AI模型和应用。为此，企业需要安全、可扩展的解决方案来避免复杂的自行解决方法。

肯睿Cloudera AI推理服务通过在企业控制范围内提供安全开发与部署，防止敏感数据泄露到云服务商托管的非私有AI模型服务中。这项NVIDIA技术驱动的服务帮助企业快速构建实现可信AI所需的可信数据，支持企业高效开发AI驱动的聊天机器人、虚拟助手和代理应用，从而提升生产力并实现业务增长。

肯睿Cloudera在与NVIDIA合作后不久就推出了肯睿Cloudera AI推理服务，进一步强调了肯睿Cloudera的承诺，即在各行各业应对数字化转型与AI集成复杂性的关键时刻，不断推动企业AI创新。

开发者可以使用NVIDIA Tensor Core GPU构建、定制和部署企业级大语言模型（LLM），其性能最高可提升36倍，吞吐量是使用CPU时的近4倍。用户界面（UI）和API可与NVIDIA NIM微服务容器直接集成，不再需要使用命令行界面（CLI）和单独的监控系统，为用户带来了无缝衔接体验。该服务与肯睿Cloudera AI模型注册表集成后，还可通过管理模型端点和操作的访问控制改善安全性和治理。用户能够在一个统一平台上通过一项服务无缝管理所有模型，无论是LLM部署，还是传统模型都不例外。

肯睿Cloudera AI推理服务的其他主要功能包括：

· 高级AI功能：利用NVIDIA NIM微服务优化开源LLM（包括LLama和Mistral），推动自然语言处理（NLP）、计算机视觉和其他AI领域的前沿技术发展。

· 混合云与隐私：在本地或云中运行工作负载，通过VPC部署增强安全性与合规性。

· 可扩展性与监控：依靠自动扩展、高可用性（HA）和实时性能追踪检测和纠正问题，实现高效资源管理。

· 开放式 API与CI/CD集成：使用符合标准的API进行模型部署、管理和监控，以便与 CI/CD流水线和MLOps工作流程无缝集成。

· 企业安全功能：通过服务帐户、访问控制、数据沿袭和审计功能执行模型访问。

· 风险管理部署：通过A/B测试和“金丝雀推广”（canary rollout）以控制模型更新。

行业分析师Sanjeev Mohan表示：“企业正对投资生成式AI热情高涨，但这不仅需要可扩展的数据，还需要安全、合规且管理良好的数据。将私有AI大规模投入生产带来了DIY方法难以解决的复杂性。肯睿Cloudera AI推理服务通过将先进的数据管理与NVIDIA的AI专业技术相结合弥补了这一差距，在保护数据的同时发挥数据潜能。凭借服务帐户、访问控制、审计等企业级安全功能，企业可以放心地保护自己的数据，并在本地或云中运行工作负载。以其所需的灵活性和治理方式高效部署AI模型。”

肯睿Cloudera首席产品官Dipto Chakravarty表示：“我们十分高兴能与NVIDIA携手推出肯睿Cloudera AI推理服务，为客户提供一个支持几乎所有模型和用例的一站式AI/ML平台。如此一来，企业既可以使用我们的软件创建强大的AI应用，也可以在肯睿Cloudera平台中运行性能卓越的AI应用。通过集成NVIDIA AI，肯睿Cloudera能够以先进的性能促进决策的智能化，使用可信数据大规模构建可信的AI应用，从而支持客户不断创新。”

NVIDIA AI软件、模型和服务副总裁Kari Briski表示： “当今企业需要将生成式AI与其现有的数据基础设施无缝集成，从而提升业务成果。通过将NVIDIA NIM微服务整合到肯睿Cloudera AI 推理服务平台中，我们支持开发者能够轻松创建可信的生成式AI应用，同时形成一个自我维持的AI数据飞轮。”

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

肯睿Cloudera发布附带嵌入式NVIDIA NIM微服务的AI推理服务

来源：至顶网软件与服务频道

2024

10/09

15:25

分享

点赞

智能体驱动全球创新浪潮，微软携手前沿伙伴迈进消费电子新未来

达索系统在CES 2026上展示AI驱动的医疗创新， 重塑精准、可预测与个性化医疗

Arm 发布 20 项技术预测：洞见 2026 年及未来发

美光推出全球首款面向客户端计算的 PCIe 5.0 QLC SSD

SanDisk重塑经典SSD品牌：WD Black和Blue正式更名为Optimus系列

福特汽车准备在车载系统中引入AI智能助手

ChatGPT推出健康模式：结合医疗数据提供个性化建议

福特推出AI数字助理及新一代BlueCruise自动驾驶技术

联想Legion Pro可卷曲概念机展现移动大屏游戏新体验

印度和新加坡在智能体AI采用方面超越全球同行

华硕CES 2026新品：更小巧的ProArt GoPro笔记本和升级版Zenbook Duo

n8n警告CVSS满分漏洞影响自托管和云版本

Cloudera：构建数据驱动平台，推动税收管理智能化

Cloudera：AI智能体的兴起让数据隐私的重要性日益凸显

NVIDIA Blackwell 现已在云端全面可用

为“代理式AI”装上“护栏” NVIDIA打造“三重防线”

黄仁勋现身北京致辞：60年后，计算机正被重新定义

CES 2025 | NVIDIA Isaac GR00T Blueprint 让人形机器人“加速进化”

未来，就在我们手中

CES 2025 | 代理式AI崛起：NVIDIA定义下一代“代理式 AI Blueprint”

深度学习最佳 GPU，知多少？

NVIDIA推出用于多语言生成式人工智能的NeMo Retriever微服务

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

达索系统在CES 2026上展示AI驱动的医疗创新，重塑精准、可预测与个性化医疗