云平台加速向AI就绪进化

作者:邹大斌   【原创】   2021-11-09 12:23:10

关键字: OpenShift AI

为了更好的支持AI应用的开发和部署,云平台开始面向AI应用进行优化,包括实现各种AI工具、框架的预集成,同时,打通数据获取、清洗、分析处理、建模等流程。

人工智能以大家可以感知的速度在快速普及。如今,越来越多的公司已经或者正在评估使用人工智能技术,来为其提供不可或缺的客户洞察力和业务工具。IDC的数据,2021年全球AI市场收入预计将同比增长15.2%,达到3418亿美元,2022年将进一步加速增长,增幅达到18.8%。

人工智能技术的普及也对底层架构提出了新的要求,这些要求不仅体现在较高的计算密度和更大传输能力的网络,还体现在要更好地承载AI应用的开发和部署。另一方面,随着云计算和容器的普及,企业开始利用容器来获得AI和机器学习生命周期的灵活性、可移植性和可靠性,容器化AI逐渐成为一种越来越常见的部署方式。在这一背景下,一些云平台将对AI应用的支持作为一个重点,面向AI应用的容器云平台也由此应运而生。

对AI支持成为云平台的核心能力 

鉴于容器化应用带来的可移植性、可扩展性等能力,利用Docker和K8s搭建容器云成为众多企业的主流应用部署平台,支撑着企业越来越多的应用,其中不乏核心的关键业务应用。另一方面,AI给企业带来的众多商业价值和商业机会使得企业AI应用的数量迅速增长,在云平台部署AI应用成为企业很自然的选择。

通过云平台或者容器云平台来统一部署包括AI在内的所有应用看起来很有吸引力。比如,AI项目通常变化快,需要快速、灵活且可扩展的环境,而云特别是混合云通过内部部署和云资源的结合能很好地满足这些需求。在混合云环境中,当需求超过内部最大能力时,可以使用外部云资源快速扩展,不管是计算还是存储能力。这不仅带来灵活性,还能带来成本的节约。

不过,那些没有专门为AI优化的云平台对于传统应用程序可能很好,但对于数据密集型应用程序(AI应用)可能会存在问题,比如过高延迟、性能不足,在流程上也不方便。因为这些平台并不能保证性能或保证处理 AI 数据所需的容量,换而言之,并非为 AI 提供端到端的应用服务而进行了优化。

AI系统是由深度学习框架、AI应用以及服务部署组成的一个闭环。在一个传统的容器云平台部署AI应用,首先要为AI应用提供一个运行环境,其中一个重要工作是部署各种AI工具,比如深度学习框架。众所周知,深度学习框架大部分是开源产品,到底选用哪个版本是一个挑战,更何况部署完后还需要不断更新。其次,AI应用的开发涉及数据获取、特征工程转换、模型分布式训练、模型验证、模型灰度发布、GPU 资源监控管理等,将整套流程的打通,并实现与其他应用的资源隔离,这些都不是原生的容器和 K8s技术所能支持的,需要进行大量技术创新。

因此,一些容器云平台开始面向AI应用进行优化,包括实现各种AI工具、框架的预集成,同时,打通数据获取、清洗、分析处理、建模等流程,为AI应用的开发和部署提供尽可能地方便。

OpenShift拥抱AI 

在容器云领域,OpenShift是一个重要的力量,尤其是在开源领域,OpenShift更是主流的存在。作为一个企业级的基于Kubernetes的容器平台,它提供了面向企业应用的容器开发、部署和管理运维功能,今天不少企业将自己的容器化应用部署在OpenShift平台。

只是OpenShift本身并非专门为AI应用而生,当在OpenShift上开发和部署AI应用的时候面临不少挑战,比如与各种AI框架的集成、流程的规范、监控和管理等。另外,传统应用和AI应用开发常常属于两个不同的群体,AI应用由数据科学家和数据工程师为主体,变化快,相关工具和框架的迭代也很快,将这些应用投入到生产环境面临挑战。而另一方面,在OpenShift平台上的DevOps开发实践应用于AI应用也是非常有意义的。

为此,红帽致力于实现在OpenShift平台上提供对AI的支持,将这两部分开发整合起来,这就有了Open Data Hub(简称ODH)项目。ODH是红帽一个开源项目,它将20多种常用工具整合到一个框架中。ODH汇集了用在典型 AI 工作流程中自动执行任务的各种软件组件,简化了数据专业人员对 AI 和机器学习功能的访问,从而大大方便了数据专业人员的工作。比如,Open Data Hub预集成常见的开发框架Tensflows、Pytorch等,免除了企业集成和验证之苦。

ODH诞生于5年前,最早只是红帽内部项目,用于存储大量数据,以便数据科学家可以访问海量数据以构建模型。项目最初,红帽工程师选择了 Ceph作为存储系统,随后工程师又将一些工具加入进来,包括Jupyter、Apache Spark 和 TensorFlow。有些 Red Hat 客户知道后对这个软件很感兴趣,并表示要试用该软件。这样,在2018 年红帽公司决定将 ODH 变成一个开源项目,供普通大众下载和使用。

ODH 软件运行在 OpenShift 之上,Red Hat 建议使用开源 Ceph 平台 Ceph Storage,但任何与 S3 兼容的对象存储都应该可以使用。ODH在 Kubernetes 和 S3/Ceph 基础之上,汇集了许多其他开源项目,这些项目被世界各地的数据科学家、数据分析师和数据工程师使用。比如,ODH 支持 Spark、TensorFlow、PyTorch、Spark SQL、Elasticsearch、Kafka Streams,还有可供数据管理员和 DevOps 工程师使用的一些工具,并且这种能力已经很好地集成在OpenShift中。在OpenShift中只要进行一些简单的点选,就可以部署一个包括Knative、Tensflows、Kafa等各种软件的开发环境,对于AI应用的开发非常友好,同时,OpenShift原来的DevOps能力、CI/CD能力也能为AI开发所用,极大地方便了AI应用的开发。

今天,面对智能化应用的大潮,企业必须拥抱AI,一个好的开发和部署平台必不可少。红帽通过OpenShift的容器化能力+ODH所提供的人工智能支持,可以帮助用户打造一个功能更为全面的新一代应用开发和部署平台。其中尤为重要的是,这种能力是建立在开源平台上,避免了厂商锁定,能最大程度地赋能客户创新,助力其开发出更具商业价值的新一代应用,以加速企业的数字化转型之旅。

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:010-62641205-5060 举报邮箱:jubao@zhiding.cn 安全联盟认证