数据中心 频道

数据中心需要“新陈代谢”

  【IT168 资讯】电费对于企业的CIO主管来说,曾经是一个可以忽略不计的花销,但今天这样的情况已经不复存在了。东方地球物理勘探有限责任公司研究院副总工程师赖能和说道:“目前,我们每天的电费大约3万多元。”人们可以估算出,一个上千平米的数据中心正在以何种速度吞噬着电能。数据中心退烧电费对于企业的CIO主管来说,曾经是一个可以忽略不计的花销,但今天这样的情况已经不复存在了。东方地球物理勘探有限责任公司研究院副总工程师赖能和说道:“目前,我们每天的电费大约3万多元。”人们可以估算出,一个上千平米的数据中心正在以何种速度

  数据中心也要“新陈代谢

  让你的数据中心时刻充满新鲜血液,或许是保持其健康运营的一个不错方法,虽然这有可能带来成本的增加。

  从大学毕业开始,匡朝阳就与计算中心结下了不解之缘。从1994年中石化华东分公司建立处理解释中心(用于解释处理地球物理数据的计算中心)开始,他就负责计算中心相应的建设工作。而今年40出头的他,在面对已经运行了十多年的数据中心时,并没有太多的对过去的回想,而是更多的对未来的展望。

  最近,中石化华东分公司正在筹划在未来两年新建一所办公楼,并将现有的计算中心迁移过去。前不久,匡朝阳刚刚得到新办公大楼的设计图纸,公司请他对新办公楼里数据中心的网络布局、通风设置等设计方案进行考虑。和很多陈旧的数据中心所面临的问题一样,中石化华东分公司处理解释中心(以下简称处理解释中心)也面临着能耗增加、散热不畅、场地紧张等问题,这也是他们决心新建一座新的计算中心的根本原因。

  当记者问他在即将面临一场“新旧交替”时的感受时,对于这个他亲身参与建设,并多年来进行管理的计算中心,匡朝阳此时更多地把它看做以往工作的一种肯定,而且对新的计算中心充满期望。“像我这个年纪的人,更多地还是向前看,还没到回想过去的时候,我想可能上了年纪我才会经常回忆。”匡朝阳说。

  而也恰恰是遵循着他的这种不断向前看的态度,中石化华东分公司处理解释中心的建设,也是采用了“新陈代谢”的方法,利用新设备来获取更高效能,并解决如今很多计算中心所面临的让人头疼的问题。

  设备不断更新

  处理解释中心里的设备可谓有年头了。从1994年开始,处理解释中心就一直购进非常先进的设备,最早使用的是IBM等的大型机。而“当时一台机器运算性能恐怕还比不上一个现在的工作站。”匡朝阳说,“当初一台大型机起码占地一二百平方米,早期的情况就是这样。”

  此后,服务器技术得到发展,多路服务器在石油行业也得到了应用,从最早的2路、4路,到后来的16路、32路。在PC集群引入到石油行业高性能计算领域之前,国内最大的机器是在吐哈油田的64路共享内存服务器。

  而从2003年开始,包括中石化华东分公司在内的很多国内石油行业开始在地球物理研究过程中采用PC集群作为高性能计算工具。“当时集群的节点规模还很小,只购买了48个CPU,此后又不断扩充。”匡朝阳说。尽管设备更新紧锣密鼓,但直到今天,华东分公司处理解释中心中仍然有一些“老掉牙”的机器,它们完成着一些特殊的任务。

  在石油行业里,高性能计算完成后,还要有一个成果输入输出的过程,这个过程需要磁带机、绘图仪的使用。而由于外设技术多年来并没有太大翻天覆地的变化,而且这个过程也并非地球物理勘探的最关键环节,因此处理解释中心就将一些老旧的设备和他们所配套的外设保留了下来。“这些机器在某些方面有它们的方便之处,我们也就没有必要用PC集群代替这一部分设备。”匡朝阳补充道。

  如此看来,中石化华东分公司解释处理中心对于IT设备的应用,应该算是节俭。但是,对于满足处理解释中心核心应用所需的计算设备,也就是完成地球物理分析计算的高性能服务器,匡朝阳却是另外一种高姿态。

  新陈代谢的妙处

  在匡朝阳看来,他要利用计算设备的快速更新,满足计算中心提升计算性能、节能降耗的需求,同时,还要用这种方法对计算中心或数据中心规模的膨胀趋势进行有效的遏制。

  这种观点,在今天IT设备更新显得“过快”,很多用户感觉应接不暇的情况下,显然很难让人理解。并且有可能受到一些挑战,有人会认为,过快地更新设备,会让用户跟在厂商的后面,沿着他们的产品路线图疲于应付。

  有用户就曾经当着某IT供应商的销售经理的面说:“你们的产品更新得快,是好事,但是,更新得太快了,我们也得跟得上才行啊。”而匡朝阳对自己的观点很是坚持,并一直在用实际行动去验证。首先,他非常关注多核技术的发展。最近两三年来,IA架构的芯片厂商不断推出更多内核的CPU,从单核到双核、从双核到四核。内核数量在翻番增长,匡朝阳预测,到2009年底,就会有服务器厂商能够推出基于更多内核CPU的产品。

  匡朝阳如此关心CPU的内核数,是有他的道理的。尽管中石化华东分公司正在筹建新的办公大楼以及计算中心,但是计算中心的占地资源仍然是非常昂贵的,它不可能无限量地增长。匡朝阳认为,在这样的条件限制下,如果仅靠增加新的服务器数量来满足业务对计算能力的需求不断增长,而不将原来计算密度很低的设备及时淘汰出去,那么新的计算中心场地,也会很快被消耗掉。

  这就好比堆积木,如果用户只能通过不断成倍增加计算中心里“盒子”数量而提高计算性能,那计算中心很快就会被成堆的盒子堆满。

  匡朝阳喜欢计算中心设备的快速“新陈代谢”还有另外的原因。实际上,目前服务器的保修期限一般都在3年左右,长一些的可以达到5年或更久,但那毕竟是个别情况。而非常能体现出IT供应商精明之处的是,“很多IT设备一旦使用超过了两三年时间,出现故障的几率就会大大增加,”匡朝阳说,“而对于超过了保修期限的设备,一旦出现问题,我们就需要花钱购买服务。”

  这笔费用无疑也是不小的。如此看来,保留住相对较旧的机器,虽然能够保护一部分投资,但是后期的维护成本以及对计算中心占地成本的消耗,可能会让被保护下来的投资不值一提。

  所以,匡朝阳的理念,就是要适时淘汰旧机器,并用具有一定性价比,且有更高计算密度的新设备“补位”。这可以缓解计算中心/数据中心规模扩大带来的压力,在匡朝阳看来,以四核服务器为例,如果一个“盒子”的计算性能可以由于采取多核技术而达到原来一个“盒子”的两倍\三倍甚至更多(实际情况中,四核处理器的性能并不能达到同频率单核处理器的4倍),那么用户就可以用同样体积的盒子来满足原来两三倍的计算需求,而不用将“盒子”的数量扩大4倍。

  基于以上种种原因,匡朝阳认为计算中心的设备应该保持一个相对较快而且合理的更新速度。“我认为机器使用年限不应该超过3年。”匡朝阳如是说。而且,在他看来,计算设备不断更新并不会带来太多的不方便,因为在机器更新时,计算中心只要更换计算节点就可以,而外设和网络布线等整体环境,都不需要大的变动。他认为,有些单位总是舍不得将老旧的机器扔掉。认为只要机器没坏,就能用。但是实际上,在他们使用这些机器的时候,成本是非常高的,机房空间、UPS、电力供应都要增加。这是一笔不划算的账。

  当然,除了不断靠更新设备来应对计算需求的增长外,中石化华东分公司还通过其他方法来缓解计算性能的压力。

  “例如,我们会在数据处理过程中采用更加合理的操作流程。在过程分析中,我们把一些数据进行重新采样,降低数据密度,这样就可以缩短运算时间。而节约时间也就创造了效益,缓解了对计算能力需求的压力。”匡朝阳说。

  “废物”利用

  对于匡朝阳的这种做法,很多人最关心的问题就是,不断更新淘汰下来的机器该如何处理?

  对此,匡朝阳表示,对于中石化这种国有企业来说,由于涉及到国有资产保护问题,想要将旧机器推向市场销售,获得一部分回流资金,往往手续过于繁琐,所以更好的办法是在内部进行“废物利用”。

  而所谓的“废物”利用,对于中石化华东分公司的日产办公和桌面应用来说,也已经可以算是性能的提高了。因为用于高性能计算的服务器,往往是采用当时业界非常先进的技术,当他们被淘汰下来之后,仍然比现在办公环节中采用的服务器性能高出很多。“有时候,我们把两路服务器中的一颗CPU拔下来,即便是这样,对于我们的桌面应用,计算性能也已经绰绰有余了。”匡朝阳说。

  不过,匡朝阳也补充道,这样处理旧机器的方法,适用于一些人员较多,具有一定的消化能力的企业。他提到一位自己的朋友,也是在企业中负责高性能计算工作,但是由于公司人员规模小,在办公、桌面方面没有太多的IT更新需求,因此很多被淘汰下来的高性能计算设备,就只能以很低的价格流向市场。“这就太不划算了”匡朝阳说。

  “新陈代谢”是应对数据中心成长压力的一个不错的办法。但是这毕竟是一个需要大量财力支持的方案,对于很多企业来说,需要具体情况具体分析,不过这种理念,倒是着实可以借鉴。

0
相关文章