• 快捷搜索
  • 全站搜索

打造机房管理平台确保信息安全

2015-08-26 15:48:21作者:中国工商银行浙江省绍兴市分行 金一长编辑:金融咨询网 赵洋
保障安全生产是银行信息科技工作的重中之重,主机房是全行信息系统安全运行的心脏。工行绍兴分行创新机房管理模式,促进信息技术与机房业务的融合,精心打造了贴合市分行主机房业务的信息化操作和管理平台。

保障安全生产是银行信息科技工作的重中之重,主机房是全行信息系统安全运行的心脏。工行绍兴分行创新机房管理模式,促进信息技术与机房业务的融合,精心打造了贴合市分行主机房业务的信息化操作和管理平台。目前,大量机房操作和管理均能通过该平台一键点击进行,使机房操作流程固定、安全高效,实现了机房管理的信息化精细化。以下将具体分为七部分说明机房各项是如何实现精细化管理的。

一、机房操作

        机房的日常操作是机房的主要工作,为使操作更加规范,我们创立了“机房电子化操作档案”和“机房电子化操作确认单”相结合的操作管理模式。

        建立机房电子化操作档案。在电子化操作档案中设置了操作次序、班次、使用机器、业务种类、业务操作流程等基础数据,一旦有新的工作需增加,只需在电子化操作档案中增加该项工作,电子化操作确认单即同步增加生效。

        每天各班人员使用电子化操作确认单对机房的各项工作进行操作确认。有些工作每星期或每个月只需做几次,电子化操作确认单能够依照日期自动判断并进行点亮或变灰。需要省行数据配合的工作,电子化操作确认单能够自动判断省行数据是否已经到达,一旦发现省行数据已到便立刻启动报警提醒。对时间点要求苛刻的工作,电子化操作确认单会自动报警提醒。

        电子化操作确认单不仅可进行操作确认,还可以双击进入相应的操作页面进行实际操作,部分工作在电子化操作确认单上只需一键即可完成。

        电子化操作确认单与电子化操作指南相关联,点击电子化操作确认单上的序号,即可打开对应的操作手册,极大地方便了新手操作。

        电子化操作确认单与电子化运行日志相关联。当天同一班次的电子化操作确认单保存后,就自动建立了该班次的电子化运行日志,打开电子化运行日志,只需填入当天的运行情况即可。

二、机房巡检

        机房巡检是机房的重要工作,通过巡检可以发现机房设备的故障或隐患。为了使机房巡检更加规范,减少巡检中的漏洞,我们建立了机房条形码扫描巡检的管理模式如图1所示,可实现以下功能。

        建立机房位置的条形码档案。在机房位置条形码档案中设置条形码、巡检位置、巡检内容,并打印出该位置的条形码,将该条形码粘贴到相应的ups、服务器、网络设备和机架。这些粘贴了条形码的设备就必须进行扫描巡检,否则将启动报警提醒,这样就可避免应检未检事件发生。

        通过无线扫描枪扫描巡检。每天机房工作人员分三次对机房内粘贴有条形码的设备扫描巡检,若未在规定时间扫描巡检,该巡检系统将自动报警提醒。

        机房条形码扫描巡检系统与机房电子化事件单关联,当发现有故障或故障隐患的设备时,点击巡检单界面的故障事件单,即可进入电子化故障事件单界面,输入故障现象后即可将故障信息发送到软硬件技术员、网络技术员或相关领导的手机上,并启动事件跟踪处理流程,直至故障排除恢复正常。

        2014年上半年通过该巡检系统,已及时发现服务器故障19起、主机房ups故障1起、主机房空调故障1起、温湿度监控模块故障1起,对保障安全生产运行起到了十分重要的作用。

三、机房监控报警

        机房监控也是机房的一项重要工作。目前市分行主机房已经安装有总省行的网络、ATM、自助终端、网点UPS、服务器、机房UPS等监控系统。为充分利用这些监控系统,及时准确地传递故障信息,尽快排除故障,我们建立了自动报警与电子化事件单相结合的管理模式。

        确保短信接口的运行正常。为确保短信接口的运行正常,我们在每天上午的电子化操作确认单中增加了短信接口检查的流程,只需在电子化操作确认单上点击即可一键完成检查。

        通过截屏技术与多功能通讯录相结合,自行开发了ATM、自助终端、防病毒、机房ups等故障报警程序,每一条报警信息都有详细记录,方便与网点核查。进入报警查询界面点击某行记录,即可显示当天该设备的所有报警信息,从故障开始时间到故障结束时间一目了然。通过调整统一多功能通讯录的手机号即可同步调整多个报警程序的短信发送手机号,大幅减少了因网点自助设备维护人员调整而重新设置报警短信手机号的工作量。

        对于一时无法解决的报警问题,通过建立电子化事件单可跟踪处理,并关联报警记录中的故障信息。

四、事件处理

        银行信科部需要处理的事件繁多,主要有NOTES反馈事件、TTMS反馈事件、软件故障事件、硬件故障事件、ATM监控事件、自助终端监控事件、UPS监控事件、网络5级事件、设备更改事件、各类报表上报事件、维护期事件、SD反馈事件等。为了高效及时地处理这些工作,我们建立了电子化公告栏、电子化事件单与事件报警相结合的管理模式,具体如下。

        建立电子化公告栏。电子化公告栏可以快捷地显示各类事件的要点、工作中需注意的事项和各类通知。该电子化公告栏能在未登录系统时就显示即实现走廊式公告栏,并能按不同的IP地址显示不同内容,既满足了快捷性的要求又满足了安全性的要求。

        建立电子化事件单。分别用红色显示所有未完成的事件、用黄色显示当天须完成的事件。电子化事件单涵盖了上述各项事件。电子化事件单分别与ATM档案、自助终端档案、网点UPS档案和多功能通讯录关联,当选择某类事件后,相对应的行部、网点、供应商、维护人员、技术人员的信息全部自动显示出来,电子化事件单保存后自动把事件信息发送到相关人员的手机上,在未处理完成前,每天都会在机房系统首页显示,并有机房人员进行督办。

        周期性事件处理。有些事件本月处理完成后以后还需处理,有些事件间隔一月或一季度或半年需要处理一次,这些事件都属于周期性事件。周期性事件不能象一般事件那样完成后直接关闭了事,否则同样内容的事件需要重新输入一遍。我们对事件进行分类,当分类选周期性事件时,该事件就不可关闭,该事件完成后只能通过增加日期的方式把事件下推到下一周期,这样当下一周期的日期来临时,该事件就会自动显示并报警提示。

图片1.jpg

五、故障处理

        保障安全生产是信息科技工作的重中之重,当生产系统发生故障时,机房人员必须快速地厘清故障类型、故障性质,能够自行处理的(如重启进程、重启机器等)即刻进行处理,无法自行处理的须立即联系相关技术人员或上报上级行,并对故障修复进行跟踪处理直至故障排除。为快速地进行故障处理、上报和跟踪,我们建立了技术支持系统、电子化故障事件单、电子化运行日志和电子化问题库相结合的故障处理模式。

        网点发生生产系统故障时,可以通过电话、NOTES、技术支持系统向市分行主机房上报故障现象。其中通过技术支持系统可以附加截屏等附件,机房系统能自动扫描技术支持系统的数据库,一旦发现有故障上报立即发出报警声提示机房人员处理。

        若故障短时间内无法解决,需要建立故障电子化事件单进行跟踪处理。若故障是网点通过技术支持系统上报,机房系统能自动把技术支持系统的故障信息关联到机房系统,直接跟踪处理。

        对于发生的疑难故障,可以通过查找电子化问题库搜索以前发生的类似故障处理方法,帮助快速地定位和处理故障。当故障排除系统恢复正常后,可将相关的信息归类到电子化问题库,以便今后再次发生时迅速查找解决方法。

        重要故障需要归类到电子化运行日志,自动生成相关的运行报表。

六、机房外来人员和设备进出

        总、省行对外来人员进出机房管理要求十分严格,每次现场检查都必会查看外来人员进出机房的各项手续。为加强外来人员和设备进出机房的管理,我们建立了外来人员进出机房电子化审批单、外来人员进出机房电子化登记簿和设备进出机房电子化审批单,对此进行精细化管理。

        当外来人员需要进入机房时,由机房人员现场输入外来人员进出机房电子化审批单,包括单位、姓名、手机、事由、证件号码、进入区域、接待部门等,通过硬控制避免了手工制单时的误填现象。保存后可自动打印进出机房审批单交由信科部总经理审批。若信科部总经理不在现场,也可通过系统进行电子化审批。总经理审批通过后,外来人员在接待人员陪同下进入机房,这时就自动生成了进出机房电子化登记簿和外来人员操作机房设备情况登记表。由于数据自动关联从而彻底避免了以前手工填写时3项内容经常不一致的现象。

        当服务器或网络设备需要进出机房时,由软件人员或网络人员输入设备进出机房电子化审批单,该审批单自动与IP地址管理系统关联,自动读取设备信息。审批单与外来人员进出机房电子化审批单一样,关键项目必须正确填写才能保存,通过硬控制避免了手工制单时的误填现象,保存后自动打印设备进出机房审批单交有信科部总经理审批。若信科部总经理不在现场,也可通过系统进行电子化审批,总经理审批通过后由机房人员检查设备才可进出机房。

七、机房数据和报表

        目前每天仍有120多个大机数据文件由省行下发到市分行,同时市分行机房每天需要进行交换数据、社保捆款数据、银保通数据、住房公积金数据等数据和报表的处理。为确保数据接收、处理和报表处理的准确性,我们建立了数据自动接收、通过操作确认单定时检查、定时自动报警和充分利用各类系统自动生成报表的管理模式。

        开发全自动数据接收工具。由于大叽数据文件下发的时间并不确定,有些是上午下发、有些是下午或晚上下发,有些是T+1天下发、甚至T+40天后下发。如何保证能够全部接收又不重复接收是个难题。为此我们开发了全自动数据接收工具,该工具能自动比较已接收数据时间和省行下发文件的时间,当发现有省行下发文件时间大于已接收数据时间的文件时就自动接收这些文件。

        通过电子操作确认单定时检查。电子操作确认单是机房操作人员每天都要操作的流程单。我们把需要进行数据检查的工作每天或每星期定时在电子操作确认单上点亮,机房操作人员只需点击电子操作确认单的检查项目,即可一键完成相关检查,既通过检查保障了数据的正常又未增加太多工作量。

        定时自动报警提醒数据处理。有些数据处理有一定的时间限制,不能太早也不能太迟,如住房公积金数据处理、银保通数据处理等。为此我们在机房系统中加入了自动报警功能,当相关时间点来到时自动弹框并发出报警声以提醒进行相应的数据处理。

        充分利用各类系统自动生成报表。建立了各种实用系统后,我们即可通过系统挖掘数据自动生成报表。如通过机房条形码扫描巡检系统可自动生成机房专用空调运行记录表、UPS设备运行记录表;通过病毒监控系统可自动生成病毒排行表、行部网点病毒考核表和防病毒监控登记簿;通过导入ATM运行数据即可自动生成下属各支行ATM考核表;通过电子运行日志即可自动生成主机房运行登记簿;通过IP地址管理系统即可自动生成服务器和网络设备标签等。

(文章来源:《金融电子化》杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章