从一组服务器转换到另一组更强大的服务器应该是件轻而易举的事情。事实上,这个过程非常常规,以至于企业没有办法来提供超过三个小时的服务中断。但是,当数据中心技术人员开始这个过程时,他们会发现连接到旧服务器的电缆都没有进行标记,也没有被正确安装在设备机架上。当他们费尽力气断开电缆,他们会发现,一些电缆接在毁坏的插头上,并且在很多情况下,他们将很难搞清楚这些电缆需要插入到新服务器的什么位置。
让我们长话短说:中断本来只需要约20分钟,而最终可能需要5个小时。此外,在面对恢复服务的恐慌中,技术人员会在设备机架之间串起临时电缆,而这些电缆会缠绕在一起,最终,企业为了清理这些电缆,需要再次中断服务。
这是一个真实的故事,可悲的是,存在问题的服务器都是关键任务服务器,他们的中断会给企业的创收活动带来严重影响。
数据中心布线是一个关键问题
我们都知道,布线是数据中心内部网络的一个重要组成部分。企业不仅要知道每根电缆的去向,而且当设备重新配置或更改时,他们需要能够找到具体的布线。这意味着,每个数据中心都应该有一个布线清单以及布线清单管理系统。数据中心管理人员必须能够在几秒钟内获得每根电缆的具体信息,包括电缆的类型和供应商、终端接点、电缆管道位置以及安装日期。
好消息是,企业没有必要使用电子表格从头开始建立这样一个系统(尽管这是从头开始的最便捷的方法,有总比没有好)。我们有各种电缆管理系统,包括从最基本的到最复杂的系统。有些系统还被绑定到网络管理系统来提供对库存系统的即时访问,当联网设备出现故障时,这能够帮助即时解决问题。还有很多系统则是作为较大的数据中心基础设施管理(DCIM)应用的一部分。例如,IBM和Rackwise在这个领域提供相当广泛的产品。另外还有开源解决方案,例如 openDCIM,也可以用来从头开始布线。
电缆管理战略
首先,企业必须对电缆进行标记。至少,每根电缆终端需要标记电缆的独特的识别号码,以及标记其用途。记住,当出现故障时,重要的是能够迅速且明确地找出具体的电缆。
数据中心也应该有一个具体的布线架构:这个架构将分配具体电缆管道到特定功能。例如,路由器、交换机和防火墙设备之间的互连电缆应该要与用于外部通信的电缆分开。(笔者想起一个这样的数据中心,其中一根双绞线悬挂在天花板上,用于外部客户访问自动服务报价处理器,每次电风扇打开的时候,这根双绞线就会在风中摇摆,客户的访问就会中断)。此外,容错架构也很重要,特别是对于串扰和噪音,以及散热而言。
这里需要大量的工作吗?有必要吗?你可以算一下:根据长度的不同,定制电缆可能要几百美元。然而,电缆故障可能导致数千美元的损失,或者至少会给生产力带来负面影响,因为技术人员很难找到电缆替换它。一个好的布线计划就像是保险政策,当故障发生时能够瞬间给企业提供保障。
那么,企业如何知道数据中心是否处于危险之中?参观一下数据中心,并检查布线。电缆是否有明确的标记和颜色编码?电缆管道是否整齐,是否按照功能进行隔离?电缆在地面上吗?如果所有这些问题的答案是否定的,那么,数据中心就存在问题。
盘查、标记,然后命名
从哪里开始呢?最好就是从盘查和标记每根电缆开始。如果你需要布线命名法,网络上有很多实用的指南来帮助你制定标记规则。在所有电缆都被定位和标记后,企业需要输入布线信息到库存系统,或者电子表格,尽管这并不是最佳办法。最终,企业将希望有一个更强大的系统,允许他们增加、移动和更改布线,而不需要增加太多开销。
最后,在库存完成,布线已经确定后,企业还需要不断进行测试,以及重新路由电缆来匹配功能和类型。改进的过程应该是连续的,这能够在非常短的时间内显著改进布线基础设施。
这里的选择很简单:你要么现在努力清理数据中心布线,要么以后为低效或标记不好的布线付出代价。一般来说,如果你等到以后再处理,成本将会更高,并且,这种延迟对你的业务有不好的影响。