• 快捷搜索
  • 全站搜索

创新举措健全机制迈入运维2.0 时代

2016-11-30 15:35:45作者:中国工商银行软件开发中心副总经理 程杰编辑:金融咨询网
工商银行面临外部经营环境的巨变,全行深化经营转型、结构调整、业务创新等工作都与科技创新和生产安全密不可分。软件中心将以高度的警觉性、责任心和使命感,全力以赴完成确保全行信息系统安全、生产运行安全、银行和客户资金安全、系统研发支持的重任,为工商银行的信息系统安全稳定运行保驾护航。

工商银行软件开发中心(以下简称中心)积极响应全行“加强科技一体化管理”的要求,完善组织机构和职能,创新举措健全机制,全力为安全生产保驾护航,在运维效能提升、应用监控体系建设、应用版本自动化部署、应用智能化运维等方面取得了阶段性的成果,为全行信息系统的安全稳定运行提供强有力的技术保障。

图片1.jpg

打破边界精细管理,全面提升运维效能

  2011 年,根据总行生产运维一体化管理的战略部署,在总行信息科技部的指导下,中心通过在两大数据中心分别部署应用支持部门,将生产支持和应用变更操作部门合并,实现技术支持部门的前移和延伸,通过开发与生产运维一体化管理,打破生产中心与开发中心的边界,做到了无缝衔接。

  一是搭建了基于ITIL 的工作流程管理平台。通过自动化的辅助工具实现对工作流程的精细化管理,实时监控各项管理指标,确保各项科技服务水平稳步提升;通过缩短流程,生产事件处理时效、生产事件一线解决率、服务需求响应及时率以及监控报警处理时效、应急处理时效等各项运维指标均大幅提升并持续保持在高水平并稳步向好。

  二是建立了应用运维成熟度评价体系。从“应用系统可用性”、“性能容量”、“应用可维护性”、“资源管理”和“运维安全性”五大方面设定了评价指标,并通过自动化的基础信息采集及加工处理,实现对各应用的综合评价。经过近几年的运维成熟度评价工作,在版本投产步骤、停机时间、批量中断情况、资源变动情况方面均有了较为明显的改善,极大地降低了投产风险。同时通过深入开展针对重点生产事件、生产异常数据等专项的治理,进一步从运维角度对产品质量进行把控,提升生产数据健康度,减少数据变更,做好软件产品核心资产的质量守护。

全面布局应用监控系统防患于未然

  为快速发现应用系统运行故障以及故障隐患,提高业务服务连续性的可靠性保障,确保生产运维安全,中心自2007 年开始全面布局应用监控系统建设,经过四个阶段的不懈努力,逐步实现了面向系统可用性监控、面向应用及业务监控、面向交易监控的全面部署。

  随着互联网金融时代的到来,系统呈现高并发大吞吐量特征,监控在处理实时性和大数据方面提出了更高的要求和挑战。从2014 年下半年开始,中心结合IT 架构转型,利用流式处理技术框架、大数据处理等新技术,在原有面向业务和应用监控基础上,以提升面向业务监控高时效监控为切入点,提出新一代监控建设思路。以高时效、松耦合、可配置首先构建工商银行的“交易监控”,实现分钟级多维度的交易核心指标统计;借助大数据平台,在实现高时效监控的基础上,积累分析诊断指标,同时为快速分析诊断以及后续性能容量分析提供数据支撑。

  截至2015 年底,交易监控功能已全面推广至主机所有联机交易并在平台侧试点了第三方快捷支付、银证转账、网银、手机银行等20 多个重点应用。日处理并纳入监控统计交易多达2.6 亿笔,实现了重点联机交易的分钟级、多维度、可配置的监控,标志着工商银行的监控体系正式迈入大数据时代。

应用版本部署自动化提升

  工商银行涉及总分行平台应用300 个左右,版本投产涉及环境数700 余套25000 多台服务器,在每月例行一次版本集中投产日的高频度投产实施过程中,在操作风险控制、投产时间控制,投产备份及应急处置等方面工作需投入较大成本,应用版本自动化部署需求迫切。

  工商银行自2010 年开始平台应用版本自动化部署工具的建设,2011~2012 年两年完成了总分行应用使用和推广;在2012~2015 年主要在投产版本备份、应用服务启停、版本回退、批量安装、变量配置管理等方面进行持续优化和不断完善。目前大部分平台应用版本投产日操作步骤数均可控制在10 步以内。通过自动化的版本部署,大大减少投产操作步骤,有效控制操作风险。通过版本自动化部署提升,扩展了投产策略可配置性、应用变量客户化部署、启停策略和备份策略等,对投产期间发生的紧急异常情况提供有效应急处置手段。

开拓创新大力发展智能化运维

  自2011 年应用支持部门成立伊始,便致力于应用运维管理智能化研究及实践。经过近几年的摸索和实践,逐步进入了运维智能化2.0 时代,自主研发的一序列流程管理平台、自动化运维工具取得了阶段性的进展,全视图、全方位、智能化的应用运维架构正在逐步形成。

  应用运维操作自动化方面,自主研发的自动化数据查询管理工具实现了生产数据查询的全流程在线管理,从流程控制、审批管理、数据保密、安全审计等方面实现系统硬控制,在大幅提高运维效率的同时,进一步提升了工商银行数据信息管理的安全性。

  运维诊断平台是各开放平台应用“一键式体检”工具,实现快速定位问题、变更后自检、全视图展现应用运行状态、自动定位应急处置预案等功能。该工具除应用支持部门使用外成功推广至所有境内分行,累计诊断1.5 万次。监控敏捷工具为日常主机应用差错数据、关键时间节点的系统状态等提供全天侯灵活的监控部署。已累计部署超过1.15 万个监控任务。通过诊断和监控,对生产隐患进行排查和处置,进一步确保了工商银行各应用系统的健康稳定运行。

  变更实施管理平台从技术手段实现变更状态和时间控制、变更用户控制、变更服务器控制、变更高亮风险提示、变更执行场所控制等合规性和安全性控制手段,减少人工操作风险,满足事后追踪、审计要求,提升运维工作效率。

健全机制全力为生产安全稳定保驾护航

  2015 年末,中心成立了生产运维管理委员会,从安全生产运维管理、研发过程管理两大方面入手,以排除风险隐患、提高应急效率、提升版本质量、确保安全稳定为目标,全方位多举措狠抓生产安全防控,从以下几个方面实现“长治久安”。

  一是以生产运维管理委员会为抓手,强化生产运维管理,定期召开例会,跟进各项措施落实进展,抓实各项整改措施。二是持续开展存量、增量版本风险隐患梳理排查,加强投产风险管理。三是深入开展软件产品核心资产质量守护,建立核心资产库,并持续完善配套管理措施,促进版本质量提升。四是完善技术规范、优化需求管理,做好业务风险控制,加强业务系统研发风险管理。五是推进运维智能化建设,持续优化和完善智能化运维工具,提升运维自动化、标准化和规范化程度,防范运维操作风险。六是明确信息安全管控职责,做好信息安全防控,持续强化“生产安全第一”原则,确保合规教育发挥实效。

结束语

  当前,工商银行面临外部经营环境的巨变,全行深化经营转型、结构调整、业务创新等工作都与科技创新和生产安全密不可分。中心将以高度的警觉性、责任心和使命感,全力以赴完成确保全行信息系统安全、生产运行安全、银行和客户资金安全、系统研发支持的重任,为工商银行的信息系统安全稳定运行保驾护航。

(文章来源:《金融电子化》杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章