【IT168 图书连载】以下内容来自由顾大伟、郭建兵、黄伟主编的《数据中心建设与管理指南》一书,由万国数据科技发展(昆山)有限公司授权IT168发布。该书是国内首部系统论述数据中心建设与管理的专著,从数据中心生命周期和数据中心可持续发展的六个基本要素出发,全面阐述了数据中心建设、管理的科学体系和方法论,以及企业级数据中心的评价体系。该书内容符合中国数据中心建设现状和发展趋势,内涵丰富,具有原创性和很强的实用性,是国内数据中心建设与应用的权威指导书。IT168数据中心频道将以每天一章的频度陆续发布,敬请大家关注。
阅读更多章节内容,请点击《数据中心建设与管理指南》专区
2.1 什么是数据中心可持续发展能力
一个数据中心的可持续发展能力主要是指保持数据中心的可持续状态,满足数据中心全生命周期内正常使用的能力。其本质概括起来主要包括数据中心的合规性、高可靠性、高可用性、功能性、经济性和可服务性这六个要素。如果这些要素受到某些限制或者考虑不全,必然就会导致数据中心的可持续发展能力大幅降低,其结果将极大缩短数据中心的生命周期。
一般来说,缺乏可持续发展规划的数据中心在运行两三年之后就会开始出现问题,到五六年时会有较多的问题集中爆发。为避免出现这种现象,在数据中心建设规划之前,就必须对数据中心全生命周期进行全面的了解,以可持续发展的眼光对六个要素和未来业务发展趋势等方面进行深入研究,并在设计阶段充分落实数据中心可持续发展的设计理念。
2.2 数据中心的生命周期
2.2.1. 数据中心项目全生命周期
1. 数据中心全生命周期的阶段划分
数据中心全生命周期,是指从建设意图产生到数据中心经济寿命结束的全过程。通常分为决策期、实施期和生产运维期,每一个时期又分为若干阶段。具体如图2-1所示。
图2-1 数据中心全生命周期
(1) 数据中心项目的决策期,是指从建设项目意图的产生到对建设项目进行科学论证并进行项目决策的全过程。具体包括对项目的业务定位、建设规模、建设标准、市场前景等方面进行研究分析,对拟建项目可行性研究做出判断和决定的过程。
(2) 数据中心项目的实施期,是指从项目的规划设计开始到项目基本建设完成并竣工验收移交的全过程。
(3) 数据中心项目的生产运维期,是指项目基本建设完成后,从项目投入使用直到项目经济寿命结束的全过程。
2. 数据中心基本建设周期
大型数据中心是一个专业化建筑,不同于一般的建筑物,其建设标准比一般写字楼、商业楼、厂房等高出很多。特别是在项目的全生命周期中,其机电部分的投入基本是土建投入的3~4倍,项目投资非常巨大。因此,数据中心建设项目具有投资回收期长、技术变化大等特点。如果采用一次性投资完成整个数据中心建设项目,势必会造成资金的长期占用,资金成本大大增加,这无疑是很不经济的做法。特别是商业化的数据中心建设项目,其建设模式与市场销售、业务需求、技术发展密切相关。因此,数据中心建设项目,必须考虑其全生命周期的经济性。通常采用分期、分阶段实施,达到先期基本建设完成、后期随需而建的目标。这就使得数据中心建设项目在其全生命周期内变得更加漫长而复杂,不仅如此,在后续生产运营期,还会不断进行扩容、更新和改造等工作。
为了更好地区分各个建设阶段,我们引入“数据中心基本建设周期”概念,是指:自项目开始至项目基本建设完成并达到预先规划要求,数据中心可以提供正常运营使用为止的一个周期。这也就是建设项目决策期和实施期的内容,不包含后期数据中心生产运营期内的扩容、更新和改造等内容。
根据项目建设的实际情况,通常将数据中心的基本建设周期细分为决策阶段、实施准备阶段、实施阶段和投产竣工阶段,如图2-2所示。各阶段的主要工作内容如下:
(1) 决策阶段:包括数据中心项目的初步可行性研究以及可行性研究,确定数据中心的投资估算。
(2) 实施准备阶段:包括数据中心建设工程的规划设计和实施准备。
(3) 实施阶段:包括数据中心的设备采购和供应、施工安装和生产准备。
(4) 投产竣工阶段:包括数据中心设备的调试、试运行和竣工验收移交。
图2-2 数据中心基本建设周期
3. 数据中心生产运维期
数据中心建设项目的生产运维期,是指项目交付使用到项目经济寿命结束的全过程,也就是项目进行生产运维活动,收回投资,实现预期投资目标的周期。由于数据中心自身的运维特点,其生产运维期与一般项目相比有很大的差别。主要体现在,为了能够更好地满足企业业务需求的不断变化,同时保持数据中心可持续发展能力,数据中心运维期会有较为频繁的扩充、扩容和更新改造等项目活动。因此,数据中心项目生产运维期的工作内容主要包括:后续项目的评价和后期数据中心的扩容、更新、改造等,其中数据中心的扩容、更新、改造又包括决策期、实施期两个阶段,并且这一过程在整个生产运维期内将不断循环直至数据中心不能满足使用要求,即数据中心的经济寿命结束。数据中心生产运维期如图2-3所示。
2.2.2. 数据中心全生命周期预测分析
数据中心生命周期指标应当确定为多少年限比较合理?这个问题一直困扰着CIO们,目前还没有答案。但是生命周期指标意义重大,它不仅关系到投资建设项目的财务分析和经济性分析,更关系到投资建设项目的决策。对于商业化数据中心,投资回收期、投资收益率是投资决策所关注的重点问题。如果在项目决策阶段对数据中心生命周期指标没有一个全面的了解和认知,将无法进行投资回收期和投资收益率的分析,进而无法进行准确、科学的财务分析和经济性分析,最终导致项目决策的失误。因此,对数据中心全生命周期的预测分析就变得尤为重要。
影响数据中心全生命周期的因素众多,例如,从外围建筑、内部的主要机电设备到IT设备都有各自不同的生命周期。具体可参考财务制度中固定资产的折旧年限有关规定,并结合数据中心业务的运维特点而定。固定资产的折旧年限参见表2-1。
表2-1 固定资产折旧年限参考一览表
根据数据中心业务的运维特点,数据中心的生命周期主要是由房屋建筑物和主要设备本身的折旧年限、IT设备及新技术发展、客户需求和经济性等综合因素所决定的。
首先,从建筑种类来说,数据中心生产运维的空间场所归属于生产用房,最大经济寿命约为30~40年,但是建筑的承重、空间结构能否满足未来30~40年数据中心技术发展的需求呢?数据中心的建设标准比一般建筑会更高,但作为专业化和商业化的建筑,根据美国、日本等多家数据中心运营商的经验,将30年作为数据中心生命周期指标是一个比较合理的数值。在这个生命周期中,对其建筑和结构的变化要求都不是很大。如果初期按照高标准的要求来规划设计,例如按照TIA-942 Tier4等级标准建立的数据中心建筑,在生命周期内,建筑物结构,包括楼层高度、楼板的承重、功能空间等方面基本上不会有太大风险。
其次,数据中心主要服务的对象是IT系统。在其30~40年的生命周期中,IT系统的变革却非常大,IT系统可能已经经历了多个生命周期。IT技术的变革同时也带动了关键基础设施技术的不断变化,因此,还要关注这些关键基础设施的生命周期。这些关键基础设施的生命周期是由其折旧年限、新技术发展、IT技术需求和经济性等多方面的因素所决定的。其中新技术的发展是数据中心关键基础设施更新换代,周期缩短的主要原因,这将取决于新技术的可行性、经济性和它对整个业务系统的支持力度。从国外运营商多年的经验来看,关键基础设施的经济寿命大约为10~15年,通常在正常运行3~5年后就需要开始启动下一轮的更新换代。但是可以看到,这个更新换代的过程不是一下完成的,通常是从周边系统开始慢慢替换,然后在4~5年的过程中慢慢实现的。这就要求在初期设计规划整个系统容量时,充分考虑到后期业务增长的要求,以及容量达到限制后如何更新和更换等问题,见表2-2。
表2-2 数据中心生命周期总结表
2.3 数据中心可持续发展能力分析
数据中心作为信息系统的基础设施,其可用性、可靠性和可服务性等问题逐步受到重视,其可持续发展能力已成为政府机构、企业业务持续运行的重要决定因素。为了适应政府机构、企业组织未来的发展,数据中心是否具有可持续发展能力就显得尤为重要。在各系统的设计和实施中,必须充分考虑系统的可持续发展问题。
2.3.1. 数据中心可持续发展影响因素
目前,那些缺乏可持续发展能力的数据中心已暴露出了较多的问题,例如供电能力不足、无法实现在线扩容、机房送回风不顺畅产生局部热点、数据中心能耗巨大等。这些问题直接影响数据中心的可用性和可靠性,大大缩短了数据中心的正常生命周期。
为避免重蹈覆辙,我们必须了解影响数据中心可持续发展能力的因素是什么。通过对国内大型企业数据中心的调查发现,可持续发展能力普遍存在不足,主要表现在以下几个方面:
(1) 初期资源规划考虑不周、缺乏业务可持续性资源计划考虑。
(2) 数据中心机房功能性差,缺乏全局规划,规划布局不合理。
(3) 建筑层高过低、结构承载能力不足,严重制约空间利用。
(4) 供电设计密度低,系统可靠性差,不能在线扩容。
(5) 系统设计缺乏经济性考虑,日常运行能耗大、营运成本高。
(6) 运维管理缺乏长期性、稳定性及适应性的考量,易出现管理混乱。
由此可以看出,影响数据中心可持续发展能力的因素有许多,涉及数据中心建设项目的各个方面。这些因素归纳起来包括合规性、可用性、可靠性、功能性、经济性和可服务性这六个方面。因此,研究数据中心可持续发展能力,必须从上述因素出发,从整个生命周期着手。生命周期内的各个阶段是一个有机的整体,任何阶段或环节出现问题都会导致数据中心可持续发展能力的丧失。
2.3.2. 数据中心可持续发展评价
前面阐述了数据中心可持续发展能力的概念和六大影响因素。本章节将结合这些因素,从宏观上全面评价什么样的数据中心才具有可持续发展能力。
1. 数据中心的合规性评价
数据中心的合规性,是指数据中心的规划、设计和建设必须符合国家相关产业政策;符合现行国家、行业及地方相关标准和规范;符合当地政府机构的规划要求。
从表面看,数据中心的合规性与可持续发展能力之间似乎没有直接关系,但恰恰相反,它是评价一个数据中心是否具有可持续发展能力的首要因素。规范是对相关群体确立的行为标准;而标准是对重复性事物和概念所做的统一规定。它是经由有关方面专家、学者协商一致,综合相关科学技术和实践经验,并由主管机构批准,以特定的形式发布等一系列严格的程序而产生的,是相关业者共同遵守的准则和依据。因此,数据中心建设、运维不合规,就会导致数据中心的安全性受到威胁。对商业化数据中心而言,还会影响客户对数据中心的信心及业务的持续发展。
数据中心的合规性涉及面非常广泛,也比较复杂。应当如何对一个数据中心的合规性进行合理的评价呢?数据中心的合规性主要从法律法规、职业安全及行业规范三大方面进行评价,而行业规范的合规性又主要从设备物理安全要求、环境物理安全要求两个方面进行。表2-3结合国内外相关标准和众多数据中心的实际运维经验,在保证数据中心安全、可靠运行基础上,再结合数据中心运维的经济性,总结了适用范围较广、涉及用户最多的数据中心合规性检查和评价要点,供广大读者参考。
表2-3 数据中心合规性评价表
2. 数据中心的功能性评价
数据中心的功能性,是指满足数据中心正常运营使用功能和服务流程所需要的某些重要特性。数据中心的功能主要是为IT系统提供可靠运行的服务支撑平台,为IT设备提供一个安全、可靠的运行环境。如果离开数据中心的功能性要求而去谈论数据中心的可持续发展能力只能是句空话。
功能性良好的数据中心应当在规划设计阶段就对其功能性进行充分的分析和考虑。建筑空间规划设计、功能区规划设计是数据中心功能性评价的核心。也可以说,数据中心的功能性评价主要评估其建筑空间规划设计和功能区规划设计是否符合使用功能和服务流程的要求,见表2-4。
表2-4 数据中心功能性评价表
3. 数据中心的可用性评价
数据中心的可用性,是指数据中心在其整个生命周期内,并在外部资源能够充分得到满足的前提下,既保持业务的连续性,又具有较高的灵活性,满足按需建设、后期升级扩容等要求。而在外部资源有限的情况下,则能够做到资源的合理使用,并确保数据中心的可靠性、可维护性等不受影响。那么应当如何去评价一个数据中心的可用性呢?主要从以下几个方面去考虑,见表2-5。
表2-5 数据中心可用性评价表
1) 数据中心资源或能力的利用与扩充
数据中心在生命周期的各个阶段都离不开资源或能力,各种资源或能力的持续可用性,以及资源利用的合理性将直接关系到数据中心的可用性。这些资源或能力主要包括配电力资源、制冷能力、水资源、通信网络资源、建筑场地空间、建筑承载能力等。因此,评价一个数据中心的可用性必须首先对其所需的资源或能力进行评价。资源的可用性除了依靠外界的持续供应保证外,更主要的是如何合理利用资源,资源的合理利用会大大提高资源的可用性,从而保证数据中心的可用性。从这个角度来说,数据中心的灵活性、扩展性、适应性、高弹性和可改造性可以称得上是数据中心的无形资源。因此,这些无形资源也是评价一个数据中心可用性的重要因素。
2) 灵活性、扩展性
没有人愿意看到自己的数据中心出现电力或生产能力不足的情况。因此,为了满足将来动态业务的需求,在规划设计阶段,CIO们必须预测5年或10年之后的电力和冷却的需求。各系统在产品选型和设计上都应具有一定的超前性并留有充裕的扩容空间,而且系统实施方案也应具有扩展性和灵活性。确保设计的灵活性和易于升级,对于数据中心的可持续发展能力来说是至关重要的。
3) 适应性、弹性
在高可用性数据中心建设中同样需要关注系统的适应性和弹性,即数据中心各系统应首先满足普遍的业务需求,同时也可以做到随着业务的扩大或变化,所需资源能够不断得到补充,最大限度地减少建设初期(或一次性)投资,做到边成长边投资,减少资金成本,提高资金使用效率。而且还可以降低一次性投资中决策失败的风险。例如,数据中心需要考虑冗余等级、功率密度等要求,以满足不同业务用途的需要。
4) 未来可改造性
随着IT技术的发展,数据中心的生命周期也会受其影响而逐渐缩短。如果数据中心具有一定的可改造性,能够与IT技术发展相适应,就能延长数据中心的生命周期,实现数据中心的可持续发展。数据中心的可改造性评价可从以下两个方面进行:
(1) 改造的经济可行性,是指改造过程中的追加投资成本效益分析,即评价改造时追加投资与项目产出比,并由此作为决策的依据之一。对数据中心的改造再应用也是延长数据中心生命周期、提高资源利用率、降低成本的有效措施。若想提高数据中心的可持续发展能力,必须降低改造成本,使改造更具经济可行性。
(2) 改造的技术可行性,是指对原项目进行改造的技术支持度、改造实现的可能性、改造后运营的安全性和可靠性评价。改造的技术可行性与技术先进性相辅相成。只有采用先进的技术,并且所用技术能够支持以后的改造,才能真正延长数据中心的生命周期,为持续发展创造条件。
4. 数据中心的可靠性评价
通常所说的可靠性是指在规定环境条件下、在规定的时间内完成规定功能的能力。数据中心的可靠性是看基础设施的无故障工作时间。无故障工作时间越长,可靠性就越高。高可靠性设计是数据中心可持续发展不可缺少的组成部分。若想确保数据中心能够为客户提供连续性服务,也必须具有高可靠性。一个数据中心的高可靠性,在满足了合规性评价后,还要从供电、空调、弱电通信安全、消防安全、基础设施产品性能等方面来评价(见表2-6)。
表2-6 数据中心可靠性评价表
5. 数据中心的经济性评价
数据中心的经济性,是指在保证功能性、可用性和可靠性的前提下,以最低的运行维护费用获得最大的经济效益。经济性评价主要是针对数据中心生命周期的经济效益进行评价,即评价数据中心生命周期内的投入与产出状况。数据中心的可持续发展追求在整个生命周期中达到非常好的的经济效益,使数据中心设计、建设、运营全过程中投入与产出的比例非常好的。显然,提高数据中心的经济性,最主要的就是降低数据中心的TCO,即减少数据中心的建设投入成本和降低后期运营成本。在数据中心TCO中,运营成本所占比重比建设成本大得多。如果运营投入过高,可能会使数据中心入不敷出,最终导致投资失败。
若要减少数据中心的建设成本,必须在各系统设计、设备配置和材料选择过程中,本着经济、实用、合理的原则,进行多方面的反复调研和论证,使各系统在保证可靠性和先进性的同时具有良好的性价比;另一方面,随着供电密度的不断提升,数据中心的能耗支出占运营成本的比重越来越大。因此,降低数据中心运营成本最重要的环节就是降低能耗支出;其次就是提高设施监控水平,提高维护管理的工作质量和效率,节省维护成本和人员成本。所以,评价能源的利用效率,是否具有合理的节能措施就显得十分重要。
综合以上分析,TCO和电能使用效率(PUE)是评价数据中心经济性的主要指标。
6. 数据中心的可服务性评价
数据中心的可服务性,是指其可以提供多元化、高效率、专业化、可持续的服务能力。主要体现在可维护性、服务可控性和运营服务能力三个方面。
(1) 可维护性是对运营期间维修和维护难易程度的度量。数据中心的可维护性是可持续发展的前提和保障。数据中心在投入正常运行之后,便开始进入系统运行和系统维护阶段。系统维护的目的是要保证数据中心正常而可靠地运行,并能使系统不断得到改善。系统维护是指有计划、有组织地对系统进行必要的改动,以保证系统中的各个要素随着环境的变化始终处于最新的和正确的工作状态。影响可维护性的主要因素是:对数据中心关键基础设施和系统的可理解性、可预见性、可修改性。这三个因素密切相关,只有正确理解各系统,才能进行恰当的修改;只有具备准确的可预见的目标,才能保证修改的正确。提高数据中心的可维护性要从最初的需求分析与设计开始,直至建设实施的全过程。如果进入维护阶段再来评价和关注,就为时己晚。
(2) 服务可控性是指用户对数据中心所提供的服务在业务种类、服务内容上有决定权,对服务实施过程及质量有不断修正和完善的能力。研究服务可控性的目的在于科学制定服务项目、理性承诺服务质量、提升数据中心服务体系的管理能力。
(3) 除了可维护性和服务可控性外,数据中心还要具备完善的服务标准体系、运营服务制度和科学合理的服务流程。服务性良好的数据中心应当能够把可维护性、服务可控性和运维服务能力紧密地结合在一起,使其能够更好地达到预期目标并实现运营资产价值的最大化(见表2-7)。
表2-7 数据中心可服务性评价表