• 快捷搜索
  • 全站搜索

“主机+ 开放”融合架构创新实践

2017-06-06 15:48:40作者:中国农业银行数据中心总经理 涂晓军编辑:金融咨询网
为适应业务快速发展的客观需求,农业银行提出全面推进信息化银行建设新战略,要求按照客户服务便捷、经营管理集约、信息整合共享的原则,统筹整合相关业务系统;优化信息系统架构,提升业务连续服务能力;

近年来,客户交易行为显著变化,金融市场竞争加剧,银行业务创新和成本控制需求迫切,业务连续性要求越来越高。为适应业务快速发展的客观需求,有效应对新机遇和新挑战,农业银行提出全面推进信息化银行建设新战略,要求按照客户服务便捷、经营管理集约、信息整合共享的原则,统筹整合相关业务系统;优化信息系统架构,提升业务连续服务能力;调整业务、应用和数据布局,打造企业级融合式系统架构;持续开展技术架构转型,从根本上提升安全生产能力。

图片1.jpg
中国农业银行数据中心总经理 涂晓军 

技术架构转型背景

        自农行全国数据大集中以来,核心业务处理和数据信息全面集中到主机上运行,开放平台主要承担交易前置处理、转发功能。通过主机的高可靠性及商品化程度,打造了一个高度集中的银行信息系统架构。这种架构性能可靠,开发人员无需过多关注底层技术实现方式,成熟稳定。但高度的业务及数据集中也使得风险高度集中,系统负载过大等问题导致业务连续运行的风险不断增加。
 
        随着云计算与虚拟化技术发展、硬件制造能力提升,开放平台在处理能力横向扩展方面有了很大进步。通过负载均衡机制,将业务分摊到多个节点处理,各节点松耦合,对底层产品的可靠性、可用性依赖降低。这种架构成本更低,可用性、可扩展性更好,尤其是随着应用规模的扩大,边际成本将更低。但这种架构的难点是做好各节点的协同工作,尤其是要处理好数据的一致性、完整性问题。必须根据业务特点,通过较复杂的应用设计,放弃实时一致性,保障最终一致性。
 
        以稳定核心系统运维与减少IT 投入为出发点,农行利用云计算和分布式处理技术,构建开放型、高容量、易扩展、成本可控、安全稳定的“主机+ 开放”融合式架构,显著降低了主机依赖,有力保障全行金融业务连续稳定运行。
 
技术架构转型与阶段性成果

        遵循信息化银行建设整体规划,坚持“安全生产第一”以及自主创新为主、引进吸收相结合的指导思想,农行从多方面推进技术架构转型。
 
        1. 统一技术架构规范,推进运维技术标准化。根据技术适度收敛的总体原则,制定技术架构和软硬件平台使用标准,规范IT 基础架构建设。将计算平台统一到X86 架构,基本实现小型机零增长;并构建Linux+ 集群数据库为主的联机业务计算环境、Linux-+MPP 架构为主的数据分析计算环境、构建集中存储与分布式存储相结合的存储模式。目前,农行已将这些使用标准明确到企业标准中。通过系统架构标准化,进一步提升信息系统的可扩展性和可移植性,降低系统运维风险。
 
        2. 构建主机开放融合架构,推进生产运行集约化。以BoEing 系统建设为契机,对核心业务系统和相关的120多个外围系统进行整体升级改造,构建了一个主机开放融合核心系统架构。
 
        一是创新主机通讯接入模式。将基于主机的三层架构简化为两层,在主机上直接采用TCP/IP 短连接接入方式,去除了主机接入中间层,形成扁平化架构。这种架构减少了出错环节,减轻了分行运维压力,构建了一个弹性好、可扩展性强的基础平台。
 
        二是合理均衡系统应用负载。在BoEing 系统的两层架构中,采用应用层负载均衡设备作为桥梁,隔离了数以万计的前台终端设备对后台的直接冲击,也可以动态调配交易负载,自动侦测和规避主机系统单个分区运行异常,从而显著提升系统整体可用性。
 
        三是大力推广基础架构云平台。针对开放平台系统多、运行环境复杂的特点,引入虚拟化、负载均衡、大数据等新技术,推广基础架构云平台,实现IT 资源和服务快速交付、动态调整、弹性伸缩,提高资源利用率。云平台自下而上分为基础设施层、资源池层、资源调度层和云管平台层。目前,农行生产环境和开发测试环境虚拟化率分别达70%、89%,云平台已成为农行基础架构领域不可或缺的首选工具和平台。
 
        3. 加快自动化平台建设,推进运行管理智能化。大力推进基础架构与应用的监、管、控自动化平台建设,实现基础设施的自动化构建、自动化监测、智能化控制和智能化管理。改进应用系统监控方式,在应用监控功能的设计上,改变以日志采集作为监控数据源的方式,而采用流量镜像技术。通过流量镜像技术实现应用监控功能具有明显优势:它对监控维度和监控指标的适应性和可扩展性强,可以灵活地根据运维和管理需要采集不同维度的数据,将监控信息集中于即时的关注点;且这种技术不消耗宝贵的主机计算资源,不因监控功能的需要而增加主机系统运行压力。
 
        4. 提高安全可控技术应用,有效保障网络和信息安全。按照监管部门“安全可控”总体要求,采用各类措施保障业务连续性和可持续发展,规避厂商集中和供应链风险。
 
        一是积极开展主机应用下移。通过将主机中非核心产品服务剥离至开放平台,逐步降低核心业务对主机系统的依赖。主机系统中实时交易下移后,单交易对主机MIPS 消耗平均降低了74%。进一步将历史交易明细数据下移到Hadoop 集群,使历史数据交易的存储和查询完全脱离主机系统。这些措施显著降低了主机的运行负载和资源投入成本。
 
        二是在应用交付、计算、存储领域,大力采用标准开放、安全可控的技术架构和产品,同等条件下优先采用国产产品。大力推广分布式架构和多中心多活架构,从系统层面降低单个节点异常对全局业务连续性的影响。农行已完成银联前置、快捷支付、安全认证平台等重要开放平台系统多活架构改造。
 
        三是构建纵深立体的外联出口深度防护架构。在传统网络层安全防护基础上,通过应用层攻击检测与实时阻断、网络流量双向应用识别、应用文件还原深度检测等技术,实现应用层攻击防护。对钓鱼网站进行主动爬取、检测和查封,对信息系统自身漏洞缺陷进行主动检测评估和事前修复,防范于未然。
 
        农行近年相继启动基础架构云平台、新一代网络架构、开放系统高可用架构改造等重点项目建设,通过各个层面技术架构优化改造,提升了生产系统的稳定性、监控有效性、资源集约化水平和信息安全防护能力,从根本上提升数据中心安全生产能力。近三年,全行突发事件数量逐年下降,核心系统主要服务时段可用率保持在99.99% 以上,变更成功率保持在99% 以上,为业务服务连续性提供了坚实保障。

建立开发与运维常态化联动机制

        系统架构的持续优化、“主机+ 开放”融合式架构的落地,离不开软件开发与生产运行部门的良性互动。应用和数据下移到开放平台,不是简单的程序和数据移植。为了保证应用的高性能、高可用、可扩展,开发人员需要梳理应用特征,从应用层面解决交易完整性、数据一致性机制,通过细化访问分类,采取读写分离、内容缓存等手段提高应用性能弱化数据关联性;通过分库分表,实现数据分布式部署,增强系统横向扩展能力。生产运行部门也要关注新技术的发展和应用,主动参与新系统架构设计和评审,注重运行结果反馈,推动系统架构的持续优化。
 
        农行建立了多项常态化联动机制:一是对于日常运行中发现的生产问题,纳入问题管理流程。通过定期召开生产运行问题沟通会,推动开发部门实施系统架构优化,解决生产发现问题,提升运行质量。二是重点关注重大工程和投产变更后的系统性能变化,将分析结果反馈到开发中心,防范因系统变更引发的性能下降风险。三是利用业务发展和系统运行数据,开展多维度的综合性分析和场景应用,既提升了日常运行质量,也为系统架构优化提供决策依据。

下一步工作计划

        下一步,农行重点从创新容灾体系架构和创建灵活高效资源管理机制角度,继续完善系统架构。依托“两地三中心”多活架构,深入推进融合式新技术架构建设,实现业务与技术整合能力、风险控制能力、科技研发创新能力显著提升,为全行经营管理提供有力科技支撑。

(文章来源:金融电子化杂志) 

扫码即可手机
阅读转发此文

本文评论

相关文章