• 快捷搜索
  • 全站搜索

城商行如何开展大数据建设工作

2016-11-25 18:24:59作者:江苏银行信息科技部总经理 葛仁余编辑:金融咨询网
江苏银行于2015 年上半年完成大数据平台选型和外部数据采集平台建设,下半年陆续推出各种基于大数据应用产品。通过近一年的实践和探索,笔者认为城商行开展大数据工作初期至少要考虑三个方面的工作:数据资源整合、能力和机制建设、应用场景设计。

江苏银行于2015 年上半年完成大数据平台选型和外部数据采集平台建设,下半年陆续推出各种基于大数据应用产品:e 融网贷、风险预警、对公资信报告等。大数据的运用极大激发了江苏银行业务创新的动力和能量,推动了江苏银行智慧化建设的进程。以“税e 融”为例,截至2016 年3月末累计发放贷款3.9 万笔,累计贷款金额67 亿元,积累了近6.39 万户潜在客户。通过近一年的实践和探索,笔者认为城商行开展大数据工作初期至少要考虑三个方面的工作:数据资源整合、能力和机制建设、应用场景设计。

数据资源整合

  整合数据资源时,需要考虑如下三个方面:一是支持更多数据类型,包括海量的结构化和半结构化的交易数据,以及非结构化数据和交互数据。二是除了传统的内部业务数据采集,还需采用爬虫、实时镜像等互联网的数据采集技术和方法,核心在于能够快速获取有价值信息以及技术的集成。三是数据的分析和应用,重点是采用大数据技术对特定数据集合进行分析,及时获得有价值的信息。

  为了更有效地处理城商行数据来源众多的问题,可以通过整合内部和外部数据,构建出一个全行的企业级“数据信息水库”,从而对数据进行规整和处理。

能力和机制建设

  有些商业银行在建设大数据平台之前,已经完成了数据仓库建设工作,并且开展了长时间的数据治理和应用工作,但投入和产出不成正比。我个人认为在有限的时间和资源的基础上,优先要考虑如下能力和机制建设: 技术平台选型、合作伙伴选择、建设共享经济生态圈、人才招募等。

  1.技术平台选型。Hadoop 采用分布式模式来存储和计算数据,这项技术至少还有两年左右的技术演化时间,因此要选择领先的、有研发支撑能力的平台变得非常重要,另外通过前几年的观察和思考,我们认为未来将会流行新一代逻辑数仓的概念和技术。

  实际上,Hadoop 技术在2015 年已经逐渐开始往数据仓库方向转变。越来越多的行业也开始用Hadoop 技术做数据仓库。数据仓库不是一个单一的数据库,而是一整套的数据管理系统,包含很多的辅助工具、一些设计理念和管理方法。传统的数据仓库技术,经过快20 年或者更长时间的发展,已经面临了一些瓶颈。包括:一是随着数据量增大,复杂程序应用的增多,传统数据仓库越来越不堪重负。二是数据的类型发生变化。过去80% 是结构化数据。现在非结构化数据和半结构化数据正在逐渐代替原本结构化数据的比例,企业需要对这些非结构化数据进行存储分析。并且需要考虑业务部门之间如何进行资源有效管理和隔离。三是数据处理的延时太长。过去整个数据架构前面是OLTP 系统,中间是ODS,后面是数据仓库层,再后面是数据集市。传统的数据仓库是每天晚上数据导入,花7~8 个小时进行批处理计算,第二天才能看到报表。四是原先的逻辑数据模型不能有效支撑数据快速分析和价值发现。

  为了解决上述传统数仓存在的问题,我们投入到了大数据平台选型中。经过慎重分析和测试,江苏银行选择符合自身需求的、成熟的并有高效技术支持的hadoop 发布产品。

  2. 合作伙伴选择。大数据技术是一项新的技术,城市商业银行要从平台技术支撑能力、应用创新能力、本地化服务能力、服务口碑、专业化程度、实施案例等方面考察合作伙伴,采用开放式的机制、选择合适的平台及应用领域的合作伙伴。同时也要从宏观角度重点了解这些合作伙伴的价值观、管理团队的理念和专业度,了解合作伙伴的市场前景等。

  3. 建设共享经济生态圈。江苏银行“融创智库”大数据平台是一个开放共享式的平台,整合了金融、社会、互联网及行内各种数据。除了行内数据外,还包含人行、银监、工商、税务、法院、环保、海关等20 余个行外数据,并运用网络爬虫技术和命名实体识别技术,抓取公共网络媒体舆情信息,形成海量外部数据集市,可以和政府、同业等形成信息共享,打造当地特色大数据共享生态圈。

  4.人才招募。大数据领域从2015 年开始有了爆发式增长,巨大的市场机遇跟发展速度也使得行业人才严重不足,银行的应用具有鲜明的行业特殊性, 因此城商行在进行大数据平台及应用建设时,需要同步招聘和培养一大批既懂Hadoop 相关大数据技术、又对银行业务了解的复合型人才,同步吸收建模专家及业务需求规划设计师。

应用场景设计

  城市商业银行普遍处于快速发展的新阶段,业务模式的创新离不开数据的支持,也对企业数据信息服务的总体能力提出了更高要求。需要用大数据思维升级改造原有的渠道服务、授信管理、内部审计、客户管理等应用系统,在客户服务、风险管理、内部管控、流程优化、营销管理等多个业务领域提升运营效率和市场竞争力,应用场景设计是成败的关键。

  江苏银行在大数据建设初期选择了营销和风控两个方面做好应用场景的突破。

  1. 营销方面。大数据营销是指通过对大量的内外部客户交易和行为数据的采集和建模分析,帮助银行的营销经理找出合理的目标客户并通过内容、时间、形式等服务方式进行预判与调配,进行精准营销的过程。做好银行客户的大数据营销,至少包含以下四点:一是用户行为与特征分析。只有积累足够的用户数据,才能分析出用户的喜好与购买习惯,这是许多大数据营销的前提与出发点。二是引导产品及营销活动投用户所好。如果能在产品生产之前了解潜在用户的主要特征,以及他们对产品的期待,那么你的产品生产即可投其所好。三是重点客户筛选。许多客户经理纠结的事是:在那么多的客户、好友与粉丝中,哪些是最有价值的用户?有了大数据技术,来自各个渠道的千丝万缕的信息,利用某种规则关联及综合起来,就可以帮助客户经理筛选重点的目标用户。四是市场预测与决策分析支持。更全面、速度更及时的大数据,必然对市场预测及决策分析进一步上台阶提供更好的支撑。似是而非或错误的、过时的数据对决策者是灾难。

  江苏银行在营销方面结合“互联网+”的思路,推出了互联网网贷e 融产品。其中“享e 融”产品面向小额的“长尾”客户,具有“纯线上”、“高效率”的特点。利用基于大数据技术的决策模型进行系统自动审批,极大地提高了业务办理效率。客户从申请提交发起到后台对客户进行数据搜集、分析、审批出额度结果仅需要5~7 秒左右,并且能够对申请网贷业务的客户进行反欺诈甄别,拒绝触犯反欺诈规则的申请客户。

  2. 风控方面。城市商业银行风险控制的核心是解决信息不对称,从而更好地实现银行与客户之间的信息平衡。大数据风控系统除了在贷前阶段提供风险事件识别功能,还提供贷后监控功能,通过批量计算已放款客户风险分值的方式,当发现借贷人在贷款期间发生逾期记录、重复借贷或者经济法律纠纷等造成风险评分恶化的情况时,及时通知客户经理或后台管理部门,提早防范风险。

  基于大数据的风险管控应分四步走:一是全面风险视图的建立。通过建立数据交互渠道,丰富数据维度,并将这些数据转化成结构化数据,加工整合形成全面的客户征信视图。二是客户线上信息识别。通过人脸识别、反欺诈侦测技术来核实客户身份和提交信息的真实性及申请者是否存在欺诈行为。常见的反欺诈系统由用户行为风险识别引擎,征信系统,黑名单系统等组成。为了进一步提升反欺诈能力,设备指纹技术、代理检测技术、生物探针技术被应用到反欺诈系统中,从多维度降低风险。三是信用评分模型建设。银行风险主要集中在注册、登录、借款、提现、支付、修改信息这六个业务场景。挖掘客户信息与客户风险表现之间的关联规则,形成欺诈模型、信用评分模型、风险评分模型等。建立多维度预警指标体系,针对不同业务定制预警指标。四是实时风控技术框架。针对互联网金融产品的风控需求,反欺诈系统需具备稳定、快速、准确的的特点,以平衡业务拓展、客户体验和风险控制三方的矛盾。通过引入实时规则引擎,可以将不断变化的业务规则剥离出来,进行动态管理和多规则多重组合,从而使系统变得更加灵活,适用范围更加广泛。

  江苏银行在风控方面推出了基于大数据的风险预警、对公资信报告、黑名单、信贷检查报告等一系列风险管控决策模型,部署在实时规则引擎之上,并嵌入到直销银行、网贷产品及传统信贷产品中去,起到了显著的风险控制效果。

  总体来看,大数据建设要走出技术驱动的误区,大数据技术始终是为业务的发展服务,要充分和业务战略融合,以满足客户的需求为导向,整体设计,重点突破,从实践中逐步积累大数据建设的经验,取得业务发展的成效。

(文章来源:《金融电子化》杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章