数据中心 频道

机房管理应杜绝空白

  【IT168 资讯】对企业来说,机房是网络的中枢,是各类信息的汇集之地,是企业重地。因此,机房的管理和维护企业IT人员主要工作之一。大家知道,正规的机房有严格的规范和标准,对温度、湿度、洁净度、电磁场强度、屏蔽、防漏、电源质量、振动、接地和安全保卫等都有强制性的要求。但在笔者的工作实践中发现,有不少机房管理者看重某些硬指标,而往往忽视了某些细节,在机房的管理和维护中留有空白。其实,这些被大家忽视的东西往往给我们带来意想不到的麻烦。下面,笔者和大家分享一下自己的经验。

  1、警惕谐波对网络设备的影响

  谐波是个电气动力学的名词,应该说与IT不相干。但对于机房中形形色色通过电力来驱动的设备来说,这又是网络工程师必须要认真面对的一个问题。谐波对网络设备稳定性的影响想必网管们都经历过,它的可怕之处在于它的隐蔽性,因它造成的网络故障网管系统基本上是无能为力的。作为机房的管理者、维护者我们所能做的就是合理的布线以及定期的检测。

  和大家分享一个相关案例:某机房在网络运行高峰期会出现网络运行不稳定的现象,表现为服务器与终端之间的数据传输频频错误,数据更新速度偶尔变慢,有时出现断续。于此类似,路由交换设备有时也会突发性地“震荡”,数据传输暂时的空白,似乎网络已经中断。经过排查,幕后的真凶就是谐波,就其根源是该企业机房的供电系统布局不够合理所致。

  要预防此类故障,笔者的经验是:首先要对电源谐波功率含量和网络错误率要定期测试,当发现错误帧时一定不要掉以轻心。另外,一路电源能带动的工作站建议不要超过30台,否则应象划分网段那样重新划定供电区域。以免内谐波功率累积过大,超过设备的容许范围。如果网络可靠性要求很高,或者对某些非常关键的网络,那么建议你将主要的网络设备如服务器、路由器等,在网络规划设计时就选择由单独的UPS供电,以消除其它电源的谐波对其带来的影响。

  2、不能忽视空气对链路的浸蚀

  网络链路暴漏在空气中,如果机房的温度、湿度、风速等不符合要求会对链路造成浸蚀。比如光纤链路就经常被大家所忽视,由于长时间暴漏在空气中,非常受到空气中的水蒸气、灰尘等浸蚀和污染。通常情况下,这类网络故障比较难以判断和定位,并且受环境因素的影响比较大。

  笔者经历过这样的案例:因光纤接头受到浸蚀,造成网络的连通性不是很稳定。症状为时好时坏,并且奇妙地与天气相关。基于光纤的特性,如果其受到浸蚀往往造成端与端之间的信号被大量反射,此时若只用测试光纤链路的物理性能是合格的,但数据通信总是不够稳定。诸如此类,为网络排错造成了很大障碍,如果工程师没有此方面的经验是很难定位的。

  要预防此类故障的发生,首先要改善机房的布线,做好链路与空气的隔绝,特别要注意链路的接头处,这是最容易造成浸蚀的地方。其次要改善机房环境,其实网络设备对环境的要求是比较苛刻的。条件允许的话,对机房的温度、湿度、风速等参数进行监控,然后根据情况进行调节。最后定期的检修也必不可少,至少一年要进行两次这样的检测,更换被浸蚀损坏的链路

  3、一定要做的记录

  某些机房管理人员技术非常不错但缺乏良好的习惯,在机房管理、维护过程中随意性太大。不仅对于机房中设备的数量、运行情况、网络布局等不够了解,而且在进行网络配置后没有做记录的习惯。这些管理过程中的空白,在一旦发生网络故障进行排错过程中其弊端暴露无遗。通常的情况是,管理员心急火燎但就是不能定位故障,工作效率非常低下。

  笔者认为机房的管理者,首先是设备记录,对机房中的设备进行分类记录,这些记录应该力求详尽。最好以表格的形式进行分类归档记录,可以包括如下内容:安装时间、维修记录、运行状态、保质期等。其次是配置记录,将设备的相应配置信息记录在案。比如连接端口、帐户、密码等。最好将整个机房的网络拓扑图画出来,然后根据布局的调整进行变动。还有一些记录也很必要,就是机房网络故障的维修记录。这些记录应该做到详尽,包括故障时间、症状、排除方法和错误原因等。在实际工作中,这些记录往往被某些管理人员所忽略,其实这些记录在案的非常有助于此后的网络排错。

  4、值得重视的机房照明系统

  照明系统是计算机机房建设中不可缺少的部分。计算机机房的照明系统既不同于一般工厂的照明,也不同于一般办公室、会议室和家庭的照明。计算机机房的照明,除一般照明应具有的性能外,还有自己特殊的要求。特别是有些计算机机房采用全封闭式结构,机房内只能采用人工光源而无自然光源。在这种情况下,机房照明系统的好环,就显得格外重要了。机房照明质量好环,不仅影响计算机操作人员和维修人员的工作效率和身心健康,而且还会影响计算机的可靠运转。

  笔者认为,一个标准的机房至少应该配备两套照明系统。首先是一般照明,来源于外界天体的自然光源和一种是人工照明即各种照明设备。对于一般照明应该达到的要求是:光线柔和,适合人体的生理需要,不能因光源产生干扰而影响计算机的干扰。另外,一定要预备事故照明。在某些特殊情况下当正常照明因故障熄灭后,事故照明能够为工作人员及时处理故障、设备转移提供了便利。

  5、机房布线不可小觑

  笔者到过很多机房,其中不少机房的布线杂乱无章。通常情况下,机房的管理者图方便或者没有认识到布线的重要性,因此大多数不会花很多的精力在这上面。通常的状况是,几十根线纠缠在一起似一团乱麻,要从中抽出一根来得颇费周折。这样的布线,不仅不美观而且其弊端显而易见。网络维护不变工作效率低下,而且线之间的电磁干扰造成网络设备性能的下降和稳定性的降低,特别会带来巨大的安全隐患。

  总结:机房的管理与维护是非常复杂与辛苦的,当然也是非常重要的工作。从细节出发,不留死角、空白,其实也可以做到某种程度的一劳永逸。希望笔者的经验对大家有所帮助。

0
相关文章