• 快捷搜索
  • 全站搜索

浦发银行:创新“两地三中心”灾备建设

2014-03-25 11:02:46作者:浦发银行 王晖 张勇编辑:金融咨询网
浦发银行于2009年底启动异地灾备项目,至2012年底,共完成核心业务、网上银行、信用卡等33个重要业务系统的异地应用级灾备建设,建成了先进的以环形架构为基础的“两地三中心”容灾体系架构,实现了规划的目标。

浦发银行一直高度重视并不断加强信息系统灾备建设。在2005年较早建成同城灾备中心的基础上,为进一步提高重大灾难风险防范能力,本行于2009年底启动异地灾备建设,目标是建成由上海生产中心、同城灾备中心、异地灾备中心组成的“两地三中心”整体容灾体系,为打造具有核心竞争优势的现代化金融服务企业奠定了坚实的信息科技风险防范基础。

一、“两地三中心”布局规划

        上海浦东发展银行作为扎根上海、服务全国的大中型股份制商业银行,从风险防范和企业社会责任角度出发,确定了“小同城、大异地”的“两地三中心”整体布局规划。针对“小同城、大异地”模式所存在的不足,进一步提出实现“双中心交替运行”的管理目标,即单个灾备应用系统(群)要具备切换到异地灾备中心持续运行、再回切到生产中心的能力,以此提高异地灾备系统的利用率和异地灾备运维人员的实战能力。双中心交替运行体现了“平战结合”的灾备建设和管理思路,通过生产和灾备系统的交替运行,既能做到切换和演练的常态化、实战化,提高整体灾难恢复能力,又能提升异地灾备建设投资回报和灾备中心的综合效益。

二、“两地三中心”架构设计

        基于上述布局规划,浦发银行“两地三中心”整体容灾架构包括上海生产中心、上海同城灾备中心和合肥异地灾备中心,架构示意图如图1所示。

以环形架构设计为基础的“两地三中心”灾备建设图1.jpg

        上海生产中心配置完整的网络接入链路、应用处理平台和存储平台;合肥异地灾备中心配置主要的第三方接入链路、关键业务的应用处理平台和存储平台;上海同城灾备中心只配置关键系统的存储平台。每家分行各有三条网络通信线路,分别与三个中心连接。

        在数据层,在三个中心之间采用三点存储数据复制架构满足异地容灾数据零丢失业务要求,在生产中心和异地灾备中心之间采用两点存储数据复制架构满足异地容灾数据丢失量小于15分钟的业务要求。

        在网络层,生产中心和同城灾备中心通过两条DWDM裸光纤直接连接,而生产中心与异地灾备中心、同城灾备中心与异地灾备中心之间各通过一条2.5G的SDH链路连接,同时满足存储数据复制和网络数据传输要求。在IP网络上,生产中心和同城灾备中心二层互联,与异地灾备中心三层连接。在SAN网络上,采用物理线路环行布置的方式建立独立的三地复制SAN网,以支持存储数据三地双向复制。

        在应用层,异地灾备中心不同应用系统按照灾备策略部署相应的主机和服务器;在同城灾备中心除共用的测试用服务器外,不部署应用主机和服务器。

三、主要技术难点

        在同业常用的“大同城、小异地”模式下,由于同城灾备中心与生产中心距离较近,数据能够实时同步复制,实现数据的零丢失(RPO=0),系统“双活”也更具实现可行性,因此相比“小同城、大异地”模式无论在灾备建设手段还是在灾备技术成熟度方面都具有一定优势。而“小同城、大异地”由于只有异地灾备中心才具有应用处理能力,在目前的技术条件下,相距数百公里的两点之间尚无法做到数据的实时同步,因此异地应用级灾备建设较同城应用级灾备建设难度更大,主要的技术难点如下。

        1.如何解决业务数据“0”丢失的要求

        随着业务处理信息化程度不断提高,存放在系统内的业务数据成为业务能否快速恢复的关键,因此需要找出在“小同城、大异地”架构下既能满足苛刻数据恢复要求,又能解决长距离数据复制不稳定问题的技术方案。

        2.如何同时满足网络安全控制和快速切换的要求

        灾备系统按其日常工作状态可分为主备系统和双活系统,前者仅在灾难发生时才启用接管业务,后者则常态化作为生产系统的组成部分对外服务,这就需要在网络上进行严格的安全控制,而在灾难情况下又能灵活快速地切换。

        3.如何提高异地灾备资源利用率

        为满足严格的RPO指标要求,在生产中心、同城灾备中心与异地灾备中心之间需要建设多条高带宽长途通讯线路。这些线路的日常运行费用在“两地三中心”总体运行成本中占有相当大的比例。如何在具体实现中减少长途线路数量、提高线路资源利用率,也是需要重点解决的问题。

 1 2 下一页 尾页

扫码即可手机
阅读转发此文

本文评论

相关文章

会议2013中国金融科技大会
浦发银行:全行集中式分行灾备建设实践

分行灾备建设的主要困难有两点,首先是投资。因为灾备系统是投入大回报低,而灾难性又是小概率,所以要想方设法降低成本。第二是