• 快捷搜索
  • 全站搜索

银行分行主机房的精细化管理

2016-01-19 17:08:47作者:中国工商银行浙江省绍兴市分行 金一长编辑:金融咨询网
保障安全生产是银行信息科技工作的重中之重,市分行主机房又是工商银行全行信息系统的心脏,因此,一直以来主机房虽然是在各种信息技术的包围之中,但很多机房管理还处于手工操作的粗放式管理模式阶段,于是机房管理成为信息化的洼地。

保障安全生产是银行信息科技工作的重中之重,市分行主机房又是工商银行全行信息系统的心脏,因此,一直以来主机房虽然是在各种信息技术的包围之中,但很多机房管理还处于手工操作的粗放式管理模式阶段,于是机房管理成为信息化的洼地。工商银行绍兴市分行(以下简称“绍兴分行”)创新机房管理模式,努力促进信息技术与机房业务的融合,精心打造了适合市分行主机房业务的信息化操作和管理平台,目前大量的机房操作和管理能通过该平台一键点击进行,使机房的操作流程固定,安全高效,工作效率得到大幅提升,工作出错率大幅降低,实现了机房管理的信息化、精细化。

一、机房操作的精细化管理

图片1.jpg

        如图1所示,机房的日常操作是机房的主要工作之一,为了使机房操作更加规范,减少工作中的差错,绍兴分行建立了机房电子化操作档案与机房电子化操作确认单相结合的操作管理模式。

        (1)建立机房电子化操作档案。在电子化操作档案中设置操作次序、班次、使用机器、业务种类、业务操作流程等基础数据,当电子化操作档案配置完成,即可在电子化操作确认单中体现。如果当天有新的工作需要操作,只需在电子化操作档案中增加该项工作,电子化操作确认单就立即同步增加生效。

        (2)每天根据电子化操作确认单对机房的工作流程进行操作确认。每天上午和下午两班分别将各自的工作在电子化操作确认单上进行确认操作,在电子化操作确认单上操作完成后,由谁操作、操作的具体时间便可一清二楚,责任十分明确,以便于日后进行分析查询汇总追责。有些工作每星期或每个月只需要做一次或几次,电子化操作确认单能按日期自动判断进行点亮或变灰。有些需要省行数据配合的工作,电子化操作确认单能够自动判断省行数据是否已经到达,一旦发现省行数据已到就立刻启动报警提醒。对于一些对时间点要求苛刻的工作,到该时间点电子化操作确认单也会自动报警提醒。

        (3)电子化操作确认单不仅可以进行操作确认,还可以双击进入相应的操作页面去进行实际的操作,部分工作在电子化操作确认单上只需一键即可完成。此外,该电子化操作确认单还支持同一天同一班次的确认单多人并发同时操作而互不干扰。

        (4)电子化操作确认单与电子化操作指南相关联,点击电子化操作确认单上的序号,即可打开对应的操作手册,极大地方便了新手操作。

        (5)电子化操作确认单与电子化运行日志相关联。当天同一班次的电子化操作确认单保存后,就自动建立了该班次的电子化运行日志,相关的值班人员、操作时间便自动登记在电子化运行日志上,打开电子化运行日志,只需填入当天的运行情况即可。

二、机房巡检的精细化管理

图片2.jpg

        如图2所示,机房巡检是机房的一项十分重要的工作,通过巡检可以发现机房设备的故障或故障隐患,对保障安全生产运行起着至关重要的作用。为了使机房巡检更加规范,减少巡检中的漏洞,我们建立了机房条形码扫描巡检的管理模式。

        (1)建立机房位置的条形码档案。在机房位置条形码档案中设置条形码、巡检位置、巡检内容,并打印出该位置的条形码,把该条形码粘贴到相应的UPS、服务器、网络设备和机架,这些粘贴了条形码的设备就必须进行扫描巡检,否则将启动报警提醒,这样就避免了由于工作疏忽或责任心不强而导致应检未检事件的发生。

        (2)通过无线扫描枪扫描巡检。每天早上、中午、晚上机房工作人员分三次对机房内粘贴有条形码的设备进行扫描巡检,如果未在规定时间扫描巡检,该巡检系统将自动报警提醒。

        (3)机房条形码扫描巡检系统与机房电子化事件单关联,当发现有故障或故障隐患的设备时,点击巡检单界面的故障事件单,即可进入电子化故障事件单界面,输入故障现象后即可把故障信息发送到软硬件技术员或网络技术员或相关领导的手机上,并启动事件跟踪处理流程,直至故障排除恢复正常。

        (4)机房条形码扫描巡检系统详细记录了机房运行的各种数据和操作人员、操作时间,进行分析查询汇总统计十分方便。还能根据巡检记录自动生成省行需要的各种报表,详见下面的“机房报表的精细化管理”一节。

        2014年上半年通过该巡检系统,已及时发现服务器故障19起、主机房UPS故障l起、主机房空调故障l起、温湿度监控模块故障l起,对保障安全生产运行起到了十分重要的作用。

三、机房监控报警的精细化管理

        机房监控也是机房的一项重要工作,通过监控发现问题需要及时通知相关技术人员、网点进行处理,对于一时不能修复的故障需要进行跟踪督促处理,直至故障排除。目前市分行主机房已经安装有总省行的网络、ATM、自助终端、网点UPS、服务器、机房UPS等监控系统,为了充分利用这些监控系统,及时准确地传递故障信息,尽快排除故障,绍兴分行还建立了自动报警与电子化事件单相结合的管理模式。

        (1)确保短信接口的运行正常。省行的短信接口已经广泛应用于各种监控系统的自动报警和各类业务通知中,对全省生产运行特别是监控报警的作用越来越重要。为了确保短信接口的正常运行,我们在每天上午的电子化操作确认单中增加了短信接口检查的流程,只需在电子化操作确认单上点击即可一键完成检查。每次短信接口发生故障时,便会打电话给省行主机房,省行还不知情。事实上多年以来绍兴分行每天一直默默承担着全省短信接口的运行检查工作。

        (2)通过将截屏技术与多功能通讯录相结合,母行开发ATM、自助终端、防病毒、机房UPS等故障报警程序,每一条报警信息都有详细记录,方便与网点核查。进入报警查询界面点击某行记录,即可显示当天该设备的所有报警信息,从故障开始时间到故障结束时间一目了然。通过调整统一的多功能通讯录里的手机号即可同步调整多个报警程序的短信发送手机号,大幅减少了因网点自助设备维护人员调整而重新没置报警短信手机号的工作量。

        (3)对于一时无法解决的报警问题,通过建立电子化事件单进行跟踪处理,同时关联报警记录中的故障信息。

四、事件处理的精细化管理

        工行信息科技部目前需要处理的事件比较繁多,主要有:notes反馈事件、ttms反馈事件、软件故障事件、硬件故障事件、ATM监控事件、自助终端监控事件、UPS监控事件、网络5级事件、设备更改事件、各类报表上报事件、维护期事件、SD反馈事件等等。有些事件由机房直接处理,有些由机房督促催办。为了高效及时地处理这些繁杂的事件,建立了电子化公告栏、电子化事件单与事件报警相结合的管理模式。

        (1)建立电子化公告栏。电子化公告栏可以快捷地显示各类事件的要点、工作中需注意的事项和各类通知。该电子化公告栏能在未登录系统时就显示出及实现走廊式公告栏,并能按照不同的IP地址显示不同的内容,既满足了快捷性的要求又保障了安全性。

        (2)建立电子化事件单。登录机房系统后首先弹出的界面就是电子化事件单,分别用红色显示所有未完成的事件、用黄色显示当天须完成的事件。电子化事件单涵盖了上述各项事件,并可以通过事件类型的设置增加事件种类。电子化事件单分别与ATM档案、自助终端档案、网点UPS档案和多功能通讯录关联,当选择某类事件后,相对应的行部、网点、供应商、维护人员、技术人员的信息全部自动显示出来,需要发送短信的人员的手机全部自动做好发送标记,能够自动填写的都能自动填写,最大限度地避免了像填写sd单那样的繁琐劳动。电子化事件单保存后自动把事件信息发送到相关人员的手机上,在未处理完成关闭前,每天都会在机房系统首页显示,并有机房人员进行催办。

        (3)周期性事件处理。有些事件本月处理完成后下个月或以后还需处理,有些事件间隔一月或一季度或半年需要处理一次,这些事件部属于周期性事件。周期性事件不能像一般事件那样完成后直接关闭了事,否则同样内容的事件需要重新输入一遍,而且很容易忘记。绍兴分行的做法是,对事件进行分类,当分类选周期性事件时,该事件就不允许关闭,该事件完成后只能通过增加日期的方式把事件下推到下一周期,这样当下一周期的日期来临时,该事件就会自动显示并报警提示。

五、故障处理的精细化管理

        保障安全生产是信息科技工作的重中之重,当生产系统发生故障时,机房人员必须快速地厘清故障类型、故障性质,能够自行处理的(如重启进程、重启机器等)即刻进行处理,无法自行处理的须立即联系相关技术人员或上报上级行,并对故障修复进行跟踪处理直至故障排除。为了快速地进行故障处理、上报和跟踪,绍兴分行建立了技术支持系统、电子化故障事件单、电子化运行日志和电子化问题库相结合的故障处理模式。

        (1)网点发生生产系统故障时,可以通过电话、notes、技术支持系统向市分行主机房上报故障现象。其中通过技术支持系统可以附加截屏等附件,机房系统能以自动扫描技术支持系统的数据库,一旦发现有故障上报立即发出报警声提示机房人员予以处理。

        (2)如果故障短时间内无法解决,需要建立故障电子化事件单进行跟踪处理;如果故障是网点通过技术支持系统上报的,机房系统能自动把技术支持系统的故障信息关联到机房系统,直接进行跟踪处理。

        (3)对于发生的疑难故障,可以通过查找电子化问题库搜索以前发生的类似故障处理方法,帮助快速地定位和处理故障。当故障排除系统恢复正常后,把相关的信息归类到电子化问题库,以便今后再次发生时迅速查找解决方法。

        (4)对于比较重要的故障,需要归类到电子化运行日志,自动生成相关的运行报表。

六、机房外来人员和设备进出的精细化管理

        一直以来总省行对外来人员进出机房的管理要求十分严格,每次现场检查都必查外来人员进出机房的各项手续是否齐全,并且特别单独制定了“外来人员安全管理手册”,同时内控部门对外来人员进出机房也有严格要求并经常对此进行检查。为了加强外来人员和设备进出机房的管理,绍兴分行建立了外来人员进出机房电子化审批单、外来人员进出机房电子化登记簿和设备进出机房电子化审批单,对此进行精细化管理。

        (1)当外来人员需要进入机房时,由机房人员现场输入外来人员进出机房电子化审批单,包括单位、姓名、手机、事由、证件号码、进入区域、接待部门等等,其中的关键项目必须正确填写才能保存,通过硬控制避免了手工制单时的误填现象,保存后自动打印进出机房审批单交由信科部总经理审批,如果信科部总经理不在现场,也可通过系统进行电子化审批,总经理审批通过后外来人员在接待人员的陪同下进入机房,这时就自动生成了进出机房电子化登记簿和外来人员操作机房设备情况登记表,由于进出机房电子化审批单与进出机房电子化登记簿自动关联,从而彻底避免了以前手工填写时2项内容经常不一致现象的发生。当同一人再次到机房时(这种情况很普遍),相关内容就会全部自动跳出,只要检查一下即可,再次填写相当方便。后续需要联系曾经进入机房的外来人员时,只要输入关键字很快就能查到联系方式,也十分便捷。

        (2)当服务器或网络设备需要进出机房时,由软件人员或网络人员输入设备进出机房电子化审批单,该审批单自动与ip地址管理系统关联,自动读取相关设备信息,该审批单与外来人员进出机房电子化审批单一样,其中的关键项目必须正确填写才能保存,通过硬控制避免了手工制单时的误填现象,保存后自动打印设备进出机房审批单交由信科部总经理审批,如果分行信科部总经理不在现场,也可通过系统进行电子化审批,总经理审批通过后由机房人员检查设备才可进出机房。

七、机房数据和报表的精细化管理

        目前每天仍有120多个大机数据文件由省行下发到市分行,同时市分行机房每天需要进行交换数据、社保扣款数据、银保通数据、住房公积金数据等等数据和报表的处理。为了确保数据接收、处理和报表处理的准确性,绍兴分行建立了数据自动接收、通过操作确认单定时进行检查、定时自动报警和充分利用各类系统自动生成报表的管理模式来有效地进行管理。

        (1)开发全自动数据接收工具。由于120多个大机数据文件下发的时间并不确定,有些是上午下发有些是下午或晚上下发,有些是T+1天下发有些是T+2天甚至T+40天后下发,如何一个不漏且全部接收又不重复接收是个难题。为此绍兴分行开发了全自动数据接收工具,该工具能自动比较已接收数据时间和省行下发文件的时间,当发现有省行下发文件时间大于已接收数据时间的文件时就自动接收这些文件。绍兴分行把该工具放在2台不同的数据接收电脑上进行自动接收,确保当某一台数据接收电脑发生故障时,另一台仍能正常工作。

        (2)通过电子操作确认单定时进行检查。电子操作确认单是机房操作人员每天都要操作的流程单,我们把需要进行数据检查的工作每天或每星期定时在电子操作确认单上显示,机房操作人员只需点击电子操作确认单的检查项目,即可一键完成相关检查,既通过检查保障了数据的正常又没有增加太多的工作量。

        (3)定时自动报警提醒数据处理。有些数据处理有一定的时间限制,不能太早也不能太迟,如住房公积金数据处理、银保通数据处理等。为此我们在机房系统中加入了自动报警功能,当相关时间点来到时自动弹框并发出报警声以提醒进行相应的数据处理。

        (4)充分利用各类系统自动生成报表。手工填写报表是一项十分繁琐且容易出错的工作,而建立了各种实用的系统后,我们就可以充分利用这些系统挖掘现成的数据自动生成所需要的报表。例如通过机房条形码扫描巡检系统,就可以自动生成机房专用空调运行记录表、UPS设备运行记录表;通过病毒监控系统就可以自动生成病毒排行表、行部网点病毒考核表和防病毒监控登记薄;通过导入ATM运行数据即可自动生成各下属支行ATM考核表;通过电子运行日志即可自动生成主机房运行登记簿;通过IP地址管理系统即可自动生成服务器和网络设备标签等。

(文章来源:《中国金融电脑》杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章