• 快捷搜索
  • 全站搜索

银行数据中心基础设施验证实践

2017-11-29 15:53:56作者:国家开发银行信息科技局 殷炜编辑:金融咨询网
目前部分欧美数据中心的建设者已经将数据中心验证作为工程质量管理的规定动作。本文从数据中心验证的作用、具体步骤、注意事项等方面,详细介绍了如何顺利完成一座大型数据中心的验证实施。

数据中心验证是业主(建设单位)对于数据中心建造质量进行确认的过程。验证期间,通过记录数据中心基础设施与机电设备的各项指标,确认其各系统是否满足业主的建设目标与运营要求。目前部分欧美数据中心的建设者已经将数据中心验证作为工程质量管理的规定动作。本文从数据中心验证的作用、具体步骤、注意事项等方面,详细介绍了如何顺利完成一座大型数据中心的验证实施。
  
数据中心验证的作用
  
  数据中心验证是在数据中心落成并即将交付使用时,从数据中心整体可用性、可靠性角度,使用假负载设备模拟不同的运行工况,对数据中心所有设备设施的功能及指标进行测试验证,最大限度保证数据中心顺利投产和安全运行(如图所示)。

图片4.jpg
图 基础设施验证在数据中心建设中所处阶段

  在数据中心投产前进行全面验证,为后续运维工作提供坚实基础:一是有利于加快投产转运维进程,运维人员参与到验证中的实际操作,提前熟悉数据中心设备设施整体情况,更利于接手运维工作;二是为投产后技术性能管理提供依据,不同负荷下的工作状态测试基本反映投产后的实际工况,为后续运维工作提供参考基线。

数据中心验证与传统工程验收的区别
  
  数据中心与传统工程验收主要有三方面区别。
  
  从高度上讲,数据中心验证更侧重于检验数据中心各系统在带载状态下的整体运行状况,而工程验收更侧重于数据中心基建过程中的施工质量。
  
  从广度上讲,数据中心验证需要测试不同系统之间联动情况,以及模拟灾难发生时数据中心的容错能力;而工程验收更侧重于系统内部各个设备设施自身的运行情况。
  
  从深度上,数据中心验证需要通过假负载模拟真实情况,检测各设备设施在带载情况下的运行状况;而工程验收通常是在空载情况下进行的。
  
如何进行数据中心验证
  
  数据中心验证一般分为三个阶段。
  
  1.前期介入阶段。前期介入阶段的工作主要有五个部分。

  图纸复审,即验证团队通过对设计图纸的复核,熟悉整个数据中心的整体架构与设计意图,同时提出设计方案中可能存在的问题。
  
  现场跟踪,了解数据中心建造实际情况,及时发现施工过程中出现的工程质量问题。
  
  设备厂验,如UPS、精密空调、配电柜、冷水机组等主要机电设备在出厂前,验证团队在设备原厂或第三方实验室参与机电设备的检测,验证设备性能参数是否符合招标文件,功能是否符合设计要求,避免设备在发货前存在无法弥补的缺陷。
  
  到货安装检验,验证团队在设备到货、设备安装时进行检验,目的是确认设备的规格型号是否与招标采购及厂验一致,是否在运输及安装过程中遭到损坏。
  
  参与调试试运行,验证团队与监理、施工等单位共同检测设备设施在空载状态下的运行情况,记录相关参数与性能指标,为下一步验证实施提供基础数据。
  
  2.验证实施阶段。验证实施阶段一般分为四个步骤。每一步骤的所有操作内容与测试结果是下一步验证实施的重要基础。

  机房模块环境验证。为逐个机房模块添加并运行假负载,测试机房模块的环境参数。主要检测内容包括:100%热负荷配电系统、制冷系统能力测试,1 00%热负荷空调冗余测试,单机柜设计最大负荷加载,单个UPS列头柜最大负荷加载,列头柜单路最大负荷加载,列头柜三项不平衡负载测试,单机房实际最大发热量,机房温升变化、湿度变化,机房实际散热能力测试,机房洁净度与压差、电场强度、磁场强度测试等。
  
  单设备带载验证。单设备带载验证的内容主要是通过假负载设备模拟真实情况,对柴油发电行机组、高低压配电设备、UPS设备、精密配电柜、冷水机组、冷却塔、板换系统、蓄冷系统、精密空调室内机等所有设备设施的运行状况与性能指标进行验证。
  
  系统带载验证。系统带载验证的重点内容包括:25%、50%、75%、100%热负荷冷水机组自动切换和制冷能力测试,100%热负荷板换换热能力测试,100%热负荷冷水系统冗余测试,100%热负荷蓄冷罐蓄冷能力测试,100%热负荷10KV高压发电模块带载测试,所有柴油机组同时启动带载运行的测试。
  
  模拟运维验证。基于运维流程,通过对数据中心可能发生的灾难预案进行预演,检测数据中心在不同灾难发生时的容错能力。重点测试内容包括:单路市电停电后恢复切换演练,10KV高压、市电停电后恢复切换演练,高压维护模拟测试,停电及恢复后制冷系统切换和启动,单路管道故障及恢复模拟演练,UPS、冷水机组、冷却塔、水泵等机电设备故障及恢复模拟演练,100%热负荷制冷系统故障温升测试,100%热负荷10KV高压发电模块冗余测试。
  
  3.问题整改阶段。验证团队根据验证期间发现的问题,对施工单位、设备厂家等的整改工作进行检查、督导,提供问题解决建议方案与指导意见,并分批次对所有问题的整改情况进行全面复核,直至确认所有问题均整改完成。

验证过程中的注意事项

  数据中心验证是一个十分复杂的过程,期间可能出现难以预测的问题或者困难。为保证验证实施顺利进行,通常有以下几点需要注意。
  
  1.验证实施条件是否成熟。在验证实施之前,数据中心现场应具备一定条件:一是现场施工与设备安装已经全部完成,工程调试与试运行完毕,现场具备工程验收条件;二是验证实施方案已经得到所有施工单位与设备厂家的确认,能够在实施期间提供配合;三是验证期间需要的所有水电资源、榆测设备、耗材等已准备就位。
  
  2.验证实施时间是否充裕。由于验证实施过程覆盖数据中心所有基础设施与机电设备,需要所有与施工单位与设备厂家全力配合,且验证期间无法预测可能遇到何种问题,因此在数据中心工程验收前,为验应证实施预留充足的时间。

  3.施工单位与设备厂家的配合。在验证实施时,所有设备设施尚未完成验收,设备设施尚未交付给业主单位。因此验证期间所有对设备设施的操作,必须在验证团队的指导下,由施工单位与设备厂家自行完成。验证方案的实施,必须取得基建负责部门以及施工单位、设备厂家的全力配合。
    
  4.所需资源与设备材料是否到位。对数据中心供电、制冷等设施进行验证时,需要消耗大量的电力、冷却水以及柴油等资源,相应的花费需要计算在项目成本中。此外,验证期间用到的各类假负载、检测设备、耗材等也应提前准备好。
  
  5.注意防范人员与设备的风险。验证期间,所有的设备设施尚未完成验收,带载运行时如操作不当,可能引起人员伤亡与设备损坏的风险。为避免这些风险发生,要确保验证方案的合理性,确保各类操作不会损坏设备或危及人员安全,设备带载量不会超过其最大运转负荷。

总结
  
  数据中心验证是数据中心整个建造过程的终点,也是数据中心投产运行的起点。一个全面的验证工作,可以极大降低数据中心早期运行的故障率,为数据中心全生命周期的稳定运行奠定坚实基础。
  
(文章来源:金融电子化杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章