减少服务器数量 整合计算资源

ZDNet软件频道 时间:2006-10-24 作者:Techrepublic.com.com |  我要评论()
本文关键词:Standard Life 网格计算 虚拟化 Comic Relief
虚拟化能够提升服务器使用率,因而被视为提高计算效率的手段,同时虚拟化技术同时也被视为减少服务器数量,降低成本的重要手段。
标准人寿公司(Standard Life)和慈善机构Comic Relief是两种完全不同的经济形式,但是他们都在利用虚拟化的强大力量。尽管虚拟化技术已在大型机和Unix环境中出现多年,但是最近x86服务器虚拟化趋势的发展颇为引人关注。

一方面,由于虚拟化能够提升服务器使用率因而被视为提高计算效率的手段。PC服务器在任何时间上对CPU能力的平均使用率只有10%,而虚拟化软件能够将使用率提高到70%,甚至80%。

另一方面,虚拟化技术同时也被视为减少服务器数量,降低成本的重要手段。这是因为虚拟化使组织机构可以在一台服务器的不同分区上运行不同的操作系统和应用,从而能够依次减少硬件采购数量、电力能源、降温开销以及数据中心空间等。

虚拟化软件在大型企业市场中正处于被主流接纳的早期阶段。2007年底,微软的Longhorn服务器操作系统加入免费Windows服务器虚拟化软件(Windows Server Virtualisation)以后,虚拟化软件还有可能在2008年和2009年进入中小企业市场。因此,现在正是通过实际用户的应用分析虚拟化优劣的大好时机。以下两个案例分别来自标准人寿公司(Standard Life)和慈善组织Comic Relief

Standard Life:服务器整合率——13:1
总部设在英国爱丁堡的Standard Life,是英国最大的金融服务企业之一,提供银行业务、养老保险、人寿保险以及个人医疗保险等服务。Standard Life从2004年3月开始进行股份制转换,其股票于2006年7月在伦敦股票交易所(London Stock Exchange)发行上市,现在为全世界超过700万用户管理着价值约1190亿英镑的资产。

为了减少服务器数量的增加,这家企业从2000年着手进行整合。在2004年大范围的Intel服务器整合项目中,为了减少运营成本,简化经营和管理而采用了虚拟化技术。技术项目经理Ewan Ferguson管理着500人的信息系统运营服务团队,他是这样解释项目进行的初衷:“在过去20年里,公司的服务器数量大规模增加,管理难度越来越大。几乎每台服务器上只运行着一个应用。虽然我们的总部设在爱丁堡,但是在全英,我们拥有大约20家办事处,因此还存在大量存储和远程管理的问题”。

为了改变服务器数量剧增的局面,Standard Life决定采用整合多个数据流的策略。首先是将第二数据中心开放为灾难恢复站点,并将企业内大部分Intel服务器移入,其他服务器依然保留在分支机构中。同时,对日常使用的硬件、操作系统、安全和补丁管理软件采取标准化管理。

第二步,企业在2002年引入了存储局域网,一开始仅用于处理文件和打印服务,后来又陆续用于对应用的支持。不过据Ferguson介绍,在2004年:“公司准备进行股份制改造,为了提高效率和业务能力,我们进行了策略性审查。我们计划理顺工作流程,从单服务器单应用向单服务器多应用发展,这时虚拟化进入了我们的视线。”

在对数百台服务器的资产进行分析时,公司发现70%的服务器的CPU能力使用率不超过10%,而内存的使用率不超过30%。在深一层的评估中又发现大约有70%的服务器都非常适合用于虚拟化。最适合的备选服务器就是那些未得到有效利用的设备,包括执行与网络关系不大的应用服务器,处理大型业务数据包或数据库等对磁盘输入输出依赖较大应用的设备等。

另外需要考虑应用厂家的软件包是否能够在虚拟化软件上运行。Ferguson说:“对于其中一两种应用,我们不得不从性能和成本效益方面进行考虑以判断这个应用是否适合转向虚拟化。在几次最糟糕的情况下,由于厂家无法提供支持,我们不得不将应用回迁。幸运的是,这些都发生在最初的风险评估阶段,项目启动以后,并没有发生单个应用回迁的情况。”

2004年的下半年,在考察过各种不同类型的虚拟化软件以后,Standard Life选择了Vmware公司的ESX服务器。Ferguson解释说:“项目实施前我们做了大量的准备工作。我们对资产中的硬件进行了妥善的处理,参考了大量案例,并向其他企业讨教经验教训。我们甚至对环境进行了测试,以考量我们能达到的虚拟化比率以及环境的稳定性。”

最终的虚拟化率(或者服务器整合率)为13:1,显著地降低了运营成本,以及电力能源消耗和维护的费用。例如,由于企业可以在虚拟设备上运行应用软件而不再需要为应用软件提供单独使用的硬盘,因此就能够提高应用服务器软件的实例数量,并且同时减少运行所需的物理服务器的数量。

服务器应用变化显著:2005年1月,370台物理设备上运行着370个应用服务器,而1年以后,在350台物理服务器上能够运行大约535个应用服务器。Ferguson说:“当资产在增加,而我们并没有追加硬件投资时,投资得到了更好地利用。现在我们机器的CPU使用率大约为70%到80%,而过去仅为10%,这样就能够更加迅速的提供服务”。

由于现在不再需要通过四个单独的业务团队完成新服务,所以过去IT服务器水平协议通常承诺在15天内实施的新服务,现在几小时就可以完成。同样地,灾难恢复的工作效率也更高。Ferguson说:“由于虚拟化软件独立于硬件之外,主机之间和数据中心之间服务的迁移就具有更高的灵活性。例如,某台托管了20个客户的局域网存储服务器突然停机,尽管也会造成影响,但已经不会造成令人颇感头疼的局面”。

灾难恢复数据中心中的另外一台主机马上启动,并在不到1小时以内开始运行,“尽管可能出现损失,但是恢复服务的时间会远远少于替换整台服务器所需的时间”。

Standard Life所使用的虚拟化软件主要用于测试和发展服务器,以及一些基础设施功能,如DNS,域控制器,安全和补丁的分发等。大型数据库和其他一些关键任务应用依然使用专用硬件设备。

Ferguson总结说:“虚拟化已经成为我们的技术战略之一,它能够提高投资的利用率,我们在提高可扩展性和性能的方面已经获得了回报,因此对于我们的Intel环境来说,虚拟化已成为不可缺少的技术”。

Comic Relief:利用网格计算集中使用IT资源
Comic Relief成立于1985年,总部设于英国伦敦的Vauxhall。这家慈善机构拥有大约100名员工,主要举办两项主要的活动来帮助英国及全世界的贫困人群。它最著名的“红鼻头日(Red Nose Day)”每逢奇数年的3月举行,下一届将于2007年举行;另外一个活动是Sport Relief,从2002年开始,每个偶数年举行。

在过去的20年里,这家机构主要在超过14000名呼叫中心志愿者的帮助下以纸上登记的方式募集善款。这种传统的手段意味着这些参与者需要2~3周的时间来处理这些募捐,如果中间出现错误,需要的时间会更长。

然而在1997年,Comic Relief首次建立了自己的网站,并通过网络获得了4万英镑的捐款。据Comic Relief新媒体负责人Martin Gill介绍说,两年以后,网络捐款数额提高到46.5万英镑,而全部捐款总额为3500万英镑,“是一个转折点,从此网站的地位从可有可无变得非常重要。对我们来说,最重要的日子就是那些活动日,因为这些活动是我们主要的筹款手段。我们需要能够100%的支撑和处理活动高峰的基础设施,并且能为愿意捐助的每一个人提供高效安全的服务。

到2005年,这家慈善机构最终决定进行一个实验性的项目:5%的呼叫中心接线员放弃纸笔,转为使用基于网络的募捐系统。而2007年的目标则是要7000到9000名员工用上网络系统。

Gill说:“建立一个可以让大量人员同时登录进行捐助的系统是非常有技术难度的,但这样的系统却能给我们带来极大的改善,因为这样就可以实时处理捐款。第二天,捐款已经存入银行。即使发生支付问题,我们也可以立即通知人们。实物捐献(Gift Aid)声明在捐献一周后就可进行,而不是几个月以后”。

于是,在技术赞助商Sun和Oracle的帮助下,这家机构采用了基于网格系统的服务器虚拟化技术进而实现了这个项目。

基于网格的系统可以通过中间件将分散在网络上的IT资源集中使用,成为一个单一虚拟计算基础设施。这种方式能够利用网格中的全部计算能力同时处理高工作负载,而无需考虑每一个计算机的位置在哪。但是工作负载的基础被分解,并分配给网络上闲置的CPU,从而充分利用这些CPU的工作能力。

为了引入网格计算功能,Comic Relief同时对原有的Oracle 9i软件进行升级,并使用Oracle的10G数据库,Real Application Clusters软件, 企业管理器(Enterprise Manager)工具的控制器以及Fusion中间件等对其进行替换,这些软件全部运行在Solaris平台上。

Gill对于这种转变解释说:“由于我们需要尽可能高效的运作,所以资源使用率和高可用性对我们来说非常重要。在没有活动时,我们只需要使用服务器资源的6%—8%,但是募捐活动进行时,基础设施又要具有足够的灵活性,能够快速跟上工作重点的变化,网格计算正好符合我们的要求。”

2006年7月15日举办的慈善Sport Relief活动,对这套系统进行了测试。与先前相比,捐款增加了15%。这家机构同时还看到,由于资源的分配对人工处理的依赖越来越少,合作伙伴派来的系统监控人员从17人减少到了10人。

Gill说:“过去我们不得不请大批的合作伙伴来帮助我们决定资源的利用问题,但是现在这个问题可以简化了。志愿者们大多数是基于自愿而工作的,这就意味着请更少的志愿者,更好地利用他们的技术,就无需为寻求某个问题的答案而笨拙地使用某些技术了。”

但是据Gill介绍,接下来是进一步提高资源的优化利用率。到目前为止,Comic Relief的资源利用率为50%-55%,但是他们希望能够将这一数字提高到75%到80%,甚至更高。Gill说:“如果公众的反应与我们预期的不同,网格计算就没有多少调整适应的空间,然而,80%的提升空间已经足以应对特殊变化的发生”。

尽管这项技术有优点,但是Gill并不建议组织机构急于采用虚拟化技术或网格计算技术。Gill说:“我们用了18个月逐步推进项目的进行,这样很适合我们。因此我想建议人们,当进入正常更新周期时,可以从建立支持网格计算的基础设施的角度来进行升级。大部分人都想既能维持基础设施,同时又能完成一些其他任务,但实际上是需要做一些实质性改变的。

最后,Gill推荐升级硬件,它介绍了集群技术或安装虚拟化中间件的发展进程,而不提倡采用冒进的方法。Gill补充说:“作为慈善组织我们所面临的挑战之一就是尽可能高的效率,特别是在技术利用的相关方面。我们需要确保我们的基础设施能够顺畅运行,我们才能分秒必争。但我们还需要确保我们的基础设施能够在需要进行灵活变化的时候进行相应的变化”。(责任编辑:王海旭

查看本文的国际来源


百度大联盟认证黄金会员Copyright© 1997- CNET Networks 版权所有。 ZDNet 是CNET Networks公司注册服务商标。
中华人民共和国电信与信息服务业务经营许可证编号:京ICP证010391号 京ICP备09041801号-159
京公网安备:1101082134