• 快捷搜索
  • 全站搜索

工商银行“两地三中心”一体化运维实践

2013-09-04 10:01:02作者:中国工商银行股份有限公司数据中心(上海)编辑:
为进一步提升信息系统灾难恢复能力,工商银行启动了“两地三中心”工程建设。未来,工商银行数据中心要努力实现生产运行管理可控、可靠、可持续的目标。

一、“两地三中心”建设历程

  工商银行于1999年开启了数据中心集约化建设的先河,在北京、上海分别建设两大数据中心后,于2002年1月在国内同业率先启动了主机灾难备份工程。经过多年的建设和持续投入,已经实现了高等级的核心系统灾备体系建设,完成了全行应用分等级灾备体系建设。为进一步提升信息系统灾难恢复能力,工商银行启动了“两地三中心”工程建设。根据规划,2014年将在上海嘉定建立同城数据中心,与上海外高桥数据中心构成同城双中心,同城双中心整体与北京异地灾备中心组成异地灾备模式(如图1所示)。

工商银行“两地三中心”一体化运维实践图.jpg

  “两地三中心”模式可以满足不同灾难场景下的恢复要求,实现更灵活的风险应对。在架构布局上,上海同城双中心具备基本相同的业务处理能力并通过高速链路进行实时数据同步,两个中心之间距离约55千米,日常情况下可按主/备或双活模式运行。在发生区域级灾难某个中心失效时,可在基本不丢失数据的情况下进行双中心间的应急切换,保持业务连续运行。北京异地灾备中心用于同城双中心的灾难恢复,当出现因大范围自然灾害等原因导致同城双中心同时失效时,异地灾备中心可以用灾备系统接管全行核心业务。

二、“两地三中心”技术手段和实施策略

  工商银行通过技术攻关,完成了“两地三中心”模式下的信息系统业务连续性架构设计和方案研究,提出了可以提供多层级业务连续性保障水平的解决方案。信息系统可以给银行业务应用提供A/A、A/Q和A/S等多种部署模式,最终以业务影响分析结果作为应用部署模式选型的决策依据。

  在具体实施中,工商银行坚持“全面覆盖基本保障能力、重点针对关键核心应用部署高等级灾备保障技术”原则,做好资源分等级和差异化配置。如ATM、POS、柜面业务、资本市场等核心业务系统是银行的关键应用,与其相关的应用系统就具有较高的业务连续性等级。自2010年工程启动以来,项目进展情况良好,完成方案规划设计和验证评审,在数据库复制技术全面推广、智能网管改造、55千米磁盘同步镜像等关键技术领域取得了突破;完成了核心主机并行系统投产,即双园区模拟同城双活的试运行,目前主机并行系统主要运行可分离查询交易,分流了部分核心生产系统的负载压力;完成13个开放平台应用服务器双活改造,预计今年将完成近50个开放平台应用的双活改造。同时,工商银行积极探索“两地三中心”运行模式,按照“一体化管理”原则,初步制定了“两地三中心”生产运行管理方案,并对组织架构和主要职能进行了规划。嘉定同城数据中心园区基建工程按计划推进,于2011年底奠基,2012年4月开工,2012年底8万平方米基建工程结构封顶,计划今年底机房楼交付使用,2014年嘉定同城数据中心园区建成启用,实现“两地三中心”的数据中心布局。

三、“两地三中心”安全措施

  1.建立全面、系统、可持续发展的信息安全管理体系
  ①以安全、稳定、高效、追求卓越为安全方针建立具有工商银行特色的ISO27001信息安全管理体系。数据中心(上海)于2011年通过了ISO27001:2005信息安全管理体系认证,实现在信息安全组织、资产管理、人员安全、物理和环境安全、通信及操作管理、访问控制等11个方面130余个控制点的全方位的信息安全管理体系。同时,建立起具有工商银行特色的支撑跨地域统一管理的ISO27001信息安全管理体系,主要包括信息安全制度管理、安全生产与运维管理、安全与防控技术管理、用户与人员管理、综合管理等五大方面共107项精细化管理制度。

  ②建设信息安全组织体系确保信息安全管理有效开展。数据中心成立了信息安全领导小组,作为信息安全管理最高管理机构,确定信息安全方针、目标和控制策略,明确信息安全的管理职责。信息安全领导小组定期或不定期召开联席会议,分析信息安全形势,研究中心信息安全管理薄弱环节及应对措施,贯彻落实监管部门、上级机构信息安全管理要求等。中心建立了纵、横向联系报告机制,及时掌握并报告本区域重大信息安全事件、案件线索或案件,提示风险,有效防控风险。

  ③信息安全管理体系随着工商银行和中心自身的发展、内外部安全形势的不断变化,与时俱进持续改进。主要措施包括:定期对人员、硬件、软件、数据与文档等各类重要资产所面临的风险进行评估,结合现有技术能力和管理成本,制定相关的补偿控制措施;利用有效的技术平台,通过完整、系统、及时的问题整改跟踪管理,将内外部审计检查发现的问题进行分析汇总,在督促及时完成整改的同时,不断挖掘制度漏洞和流程缺陷,及时完善管理体系;主动对生产故障事件、外部信息安全重大事件等进行分析研究,深入剖析问题发生和防控失效的深层次原因,进一步细化制度执行要求、强化技术硬控制、优化生产运维流程;积极与外部审计监管单位、各行业先进企业进行沟通,主动学习借鉴国际先进标准和业界领先经验,不断完善优化中心的信息安全管理体系。

 1 2 下一页 尾页

扫码即可手机
阅读转发此文

本文评论

相关文章