• 快捷搜索
  • 全站搜索

光大银行TIA-942标准下灾备体系建设实践

2014-08-27 11:20:33作者:中国光大银行信息科技部总经理 杨兵兵编辑:金融咨询网
在银行业务信息数据化管理的时代,灾备系统建设对保障银行在紧急情况下的持续正常运营具有重要意义。光大银行数据中心参照“两地三中心”的灾备规范,根据TIA一942标准构建银行灾难备份系统;在灾备系统建设中采用“同城双活,异地灾备”的架构,建立起高标准、高质量的灾备体系。

灾难备份建设是一项复杂的系统工程,不仅涉及技术和业务方案,还涉及应对特殊事件的组织、协调、管理等方面内容。为防范灾难和风险,国内商业银行相继建立了同城和异地灾备中心,“两地三中心”已逐步成为商业银行广泛采纳的灾备建设模式。

光大银行灾备体系建设思路

        光大银行生产中心、同城灾备中心和异地灾备中心符合监管部门“两地三中心”的灾备体系建设要求,数据中心的建设严格执行国家相关规范,同时参照TIA一942相应等级建设要求,使光大银行的灾备体系建设能有效防范建筑物级和区域性灾难风险,灾难恢复能力达到5级。

杨兵兵.jpg

        1. 数据中心灾备布局及策略

        光大银行的生产中心位于北京上地,同城酒仙桥灾备中心距离生产中心约21公里。同城灾备中心一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。异地灾备中心位于武汉,距北京约1150公里,用于防范战争、地震、水灾等区域性灾难。上地生产中心为自有机房,酒仙桥和武汉灾备中心采用场地外包、自主运维模式。

        2. 灾备信息系统建设架构

        光大银行信息系统采用同城双中心运行模式,所有生产系统在同城两个中心都具有相同处理能力的运行环境,互为备份,系统切换时间小于30分钟。充分利用双中心运行模式,有效避免了因系统升级、硬件故障、机房搬迁等原因造成的停机,成为快速处置信息系统突发事件的有效手段。异地灾备中心实现了重要系统的应用级灾备,并规划实现全部系统的数据级灾备,灾难情况下可在8小时内切换到异地灾备中心,接管全行柜面、支付结算等主要银行业务的运行。

        3. 数据中心灾备网络建设

        光大银行现有网络中采用的是双星型结构。以同城主、备两个数据中心为两个核心节点,两个核心节点间由高速链路(DWDM)连接。灾备中心与原有的2个数据中心形成两地三中心的网络结构,通过灾备中心的建立形成三个数据中心的结构。各分行通过三条链路分别上连至上地数据中心、酒仙桥数据中心和武汉灾备中心。保证即使是一个地区由于自然灾难等因素产生业务瘫痪,还可以通过异地灾备中心保障关键业务正常运转。

        4. 数据备份与容灾机制

        光大银行SRDF/STAR三点容灾方案由3台VMAX组成,分别放置于上地、酒仙桥机房和武汉数据中心。3台VMAX阵列间通过DWDM链路和FCIP链路连通形成数据保护环路,实现对应用系统的三点容灾保护。两个同城数据中心利用EMCSRDF同步数据复制技术确保上地数据中心与酒仙桥数据中心数据实时复制实现RP0=0,异地灾备中心利用EMC SRDF异步数据复制技术实现RPO=10。

TIA一942标准在光大数据中心建设中的应用

        1. TIA一942标准解读

        商业银行数据中心的安全、稳定运行是银行提供不间断优质服务的基础。监管机构十分重视商业银行的数据中心建设,发布了商业银行数据中心监管指引,明确要求商业银行数据中心的机房可用性应达到99.9%。但目前我国机房建设规范《电子信息系统机房设计规范》的分级标准是按照机房的重要性分为A、B、C三级,每个级别未规定可用性指标,因此,在数据中心设计和建设标准的选定上,应以国标为基础,同时参考国际标准TIA一942。

        TIA一942数据中心标准对数据中心可靠性进行了量化,共分为4个级别。Tier1可靠性没有冗余,Tier2基础设施具备冗余,Tier3基础设施可同时维护(可用性99.982%),Tier4则提供了最高等级的故障容错率(可用性99.995%)。T3和T4等级的可靠性达到99.9%,可作为商业银行数据中心的建设标准。其中供配电系统、制冷系统是数据中心安全运行的基础保障,TIA一942中对系统冗余度方面的设计要求更具体,分析如下。

        TIA—942明确提出供配电系统应不存在单一故障点,并要求发电机应设立分立、冗余的油罐及管道系统保证柴油受到污染或系统设备故障时不影响整个发电机系统。国内很多早期建设的数据中心往往采取双路供电输入后进行一次互投,与应急发电机再进行第二次互投。然后为整个数据中心提供电力,这样就造成互投开关和输出线缆这一段供配电线路成为单一故障点,出现问题进行系统维修时将无法输出电源,严重影响数据中心的运行安全。

        机房的制冷系统能够保障IT正常工作运行环境,制冷系统出现问题如果在一定时间内无法尽快解决,机房环境温度的升高可能造成IT设备宕机,因此需要制冷系统能够为机房设备提供连续性的冷源。TIA一942中要求制冷系统采取冗余设计,系统维护时应能够对故障进行隔离才能不影响冷冻系统的运行,并对制冷管路提出了双路径的要求。

        2. TIA一942标准在数据中心建设中的应用

        光大银行对自建机房及外包机房提出了明确的设计指标和性能参数需求,根据业务可用性要求严格遵循国家机房建设规范,并参照TIA一942规范等级标准规划建设数据中心,“两地三中心”的机房可用性连续3年达到100%。

        光大银行机房建设依托可靠的环境保障,具有很高的抗震等级,电磁脉冲防护、防化、防火、防盗等级符合严格的灾备标准;供配电系统由来自两个不同变电站提供的两路市电引入数据中心,与应急发电机组、多台UPS以及蓄电池组成2N供配电结构,供配电系统的建设不存在单一故障点,保障系统永不掉电;根据制冷量及实际基础条件确定制冷方式并采取冗余设计,制冷管路采用环形的双路径的设计方案,同时对应急供冷进行综合评估和规划,确保机房环境的温湿度数值在可控范围内,提高了制冷系统的可靠性;严格按照数据中心机房建筑防雷接地规范,采取综合性的防雷接地措施,确保数据中心机房内各设备系统正常运行;通过选择智能化程度高的、性能优越的安防监控、报警及门禁系统设备,灵活且严密监测数据中心机房内的各重要出入口通道、机房通道、基础设备房,使数据中心区域监控、监测无盲区和死角,确保数据中心机房的高安全性;建立全面、完善的智慧能源运维管理监控系统,实现先进的集中管理监控,实时监控、监测整个数据中心基础设施和机房内设备的运行状况,采用多种报警方式,简化数据中心机房管理人员的维护工作,为中心机房安全、可靠的运行提供最有力的保障。

光大银行数据中心建设展望

        光大银行在“两地三中心”的灾备体系建设中率先采用了同城双活架构,此种灾备架构一直被同业作为灾备建设的典范之一,并获得了监管部门的高度评价。随着光大银行远期自有产权主、备数据中心建设规划的确立,光大银行将继续坚持以数据零丢失和“本地双活、异地灾备”为原则,以TIA一942 Tier4标准为依据,高标准、高质量地建设远期数据中心,在现有基础上进一步完善灾备体系,提高灾备中心的灾难恢复能力。

(文章来源:《金融电子化》杂志)

 

扫码即可手机
阅读转发此文

本文评论

相关文章