工商银行大数据与人工智能实验室将继续开展大数据及人工智能领域的前瞻性研究,以扎实的技术研究快速推进IT架构转型及应用成果转化,将服务业务、服务客户作为最终目标。
近年来,大数据及人工智能发展迅速,分布式技术的完善、机器学习算法的丰富使得复杂任务处理准确率得到大幅提升,各类应用实践案例和效果在各行各业逐步显现。国家在“十三五规划”中提出了“重点突破新兴领域人工智能技术”,国家层面和地方层面相继出台各项政策对发展大数据和人工智能进行有力支持。工商银行一直坚持以聚焦能力建设、保持科技领先为导向,持续加大创新投入,深入开展前瞻性技术研究,通过技术创新推进业务模式创新,将科技优势转变为业务优势。
根据“主动跟踪大数据、人工智能等新技术的发展动态,开展各项新技术在银行业务的前瞻性研究,根据有意义前景推动新技术落地实施,实现前瞻性研究成果的价值转化,探索智能科技,打造智慧金融”的相关指导思想,工商银行大数据与人工智能实验室(以下简称“实验室”)应运而生,深入开展大数据技术框架、大数据服务云平台、机器学习、自然语言处理、图像识别等大数据及人工智能领域新技术的研究与探索,把握金融科技创新趋势,助推工商银行IT架构转型。
一、顺应趋势,构建研究体系新局面
为把握趋势,在金融领域保持领先地位,大数据及人工智能实验室构建了技术基础框架、大数据服务云平台、人工智能机器学习平台三大研究体系。
1.构建全面丰富的技术框架
现有的大数据技术复杂度高,应用门槛高,不便于快速应用于各业务系统。为屏蔽复杂技术,加快业务落地,实验室研究梳理大数据领域的基础技术组件、基础服务组件和配套服务组件进行组合与封装,明确技术框架范围和各技术组件的定位。通过引入新型的组件,进一步增强存储引擎、计算引擎和基础设施的技术支撑能力,以产品组合的方式解决原先单一产品专业化程度偏高、无法满足各种灵活的数据使用场景的问题。致力于提高大数据服务云及人工智能平台的易用性,以达到快速、灵活的设备供给,满足业务快速增长的需要。
2.打造弹性拓展的大数据服务云平台
随着工商银行业务不断创新发展,各业务部门、境内外分行对大数据应用提出了更高要求,自主搭建大数据平台存在技术投入和硬件投入等方面的困难,同时也会造成资源浪费,无法形成规模化效应。
在挑战与困难面前,实验室借鉴公有云思路,搭建全行统一的、高容量、易扩展、强计算的大数据服务云(如图1所示)。具备多租户的资源动态调配及PB级海量数据存储,提供高效、成本可控的大数据分析挖掘能力、高速的大数据实时计算能力、强大的大数据离线处理能力,为我行客户营销与服务、风险管控、经营管理等提供数据支撑。
工商银行通过大数据服务云的建设,支持未来大数据发展数据多样化、服务能力实时化、算法引擎智能化、基础平台云化的四大趋势与要求,具备“全、快、准、共享”的特征。
3.搭建自主可控的人工智能机器学习平台
实验室紧跟人工智能相关前沿技术步伐,实现机器学习、自然语言处理、图像识别等人工智能技术在工行反欺诈、智能客服等领域的原型验证和试点应用,取得一定业务效果。通过原型研究成果,结合业务未来发展需要,工商银行坚持以自主可控原则,集成机器学习、自然语言处理、图像识别等技术,搭建适合的机器学习平台(如图2所示)。
而根据人工智能各垂直领域特点,基于机器学习平台开展研究,并构建了语义分析、图像识别等原子服务,降低垂直应用使用机器学习平台门槛,使其无需关心人工智能技术和底层算法的实现,只需分析业务场景并基于服务构建业务应用即可,推进机器学习平台在各垂直领域的应用,助力智慧银行建设。
二、勇攀高峰,丰富研究领域新成果
在明确的研究方向的指引下,实验室以研究—原型—落地为研究思路有条不紊地开展研究工作,在各领域均取得了阶段性的成果。
1.构建全面丰富的技术框架,提升企业级技术服务能力
实验室对大数据框架下商业、开源、自主研发的技术组件包括存储、计算引擎、NOSQL数据库、分析工具、搜索技术、流技术、对象存储等技术进行跟踪,对各组件的适用场景、工商银行现状,组件交叉关系、发展规划等进行梳理研究,完成《大数据技术框架综述》。
同时对人工智能相关的AI算法、深度学习框架、语音识别、计算机视觉、自然语言处理、知识图谱、图计算、GPU加速等技术进行业界技术跟踪,对人工智能在客户营销、风险防控、客户服务、经营管理等业务应用场景进行规划,完成《人工智能技术研究综述》,进一步明确了人工智能技术在工商银行的规划思路。
以上基础技术框架的研究为大数据服务云平台和人工智能机器学习平台的搭建提供有效支持。
2.打造弹性拓展的大数据服务云平台,提升工商银行大数据基础平台服务水平
经过多年建设,工商银行已经进入大数据2.0阶段,有力地支持了各项业务的开展,主要涵盖了经营分析、风险管理、监管报送、内部管理、客户营销、互联网金融等各个领域。
在风险管理方面,基于大数据服务云实时计算服务支持企业级反欺诈管理平台、企业级业务运营风险监控平台、实时数据处理平台、支付清算应用等研发,完成覆盖境内外的电子银行事中监控、业务运营风险监控、黑名单检测等建设,目前日均承接近5亿笔主机交易和7亿笔平台交易,峰值交易量每秒超万笔,平均响应时间为毫秒级。
在客户营销方面,基于大数据服务云,实现客户画像信息的整合与服务(如图3所示),其中个人客户营销画像面向全行客户提供大数据信息服务,近一个月的累计使用客户数达100多万,日均使用用户数超过5万人次,同时通过传统PC端、客户经理营销PAD和融E联渠道展现客户画像,为客户经理营销工作提供有力抓手,截至目前全行客户经理累计使用客户画像次数近1000万次,近一个月使用近500万次,日均使用超过1万次,而个人客户风险画像则在融e借白名单与授信管理、卡部营销及授信使用方面发挥积极作用。
在监管报送方面,借助于工商银行大数据云平台实现全自动化报送,今年以来EAST数据报送工作开展高效稳定,快速满足监管要求,报送数据量达上百亿,报送周期从一个月缩短到一周。
在经营决算方面,根据减值拨备管理需要,基于大数据服务云,新建减值测算系统,测算范围覆盖信贷、金融市场、票据、信用卡及消费贷款等业务系统,该系统承担全行约2亿笔债项的减值测算功能,为业务部门研究减值模型参数对减值结果及全行利润的影响提供预测手段,在减值拨备管理上起到了重要的作用。
3.搭建自主可控的人工智能机器学习平台,优化工商银行金融服务流程
在机器学习平台建设方面,深入研究开源、商用机器学习平台,基于开源H2O机器学习框架自主搭建工商银行机器学习平台,并将其运用到智能营销、反欺诈等场景中。反欺诈场景根据机器学习模型生成的1000条名单,在外呼量相同的情况下,模型可识别的欺诈交易比专家规则识别率高出50%以上,在识别相同笔欺诈交易的情况下,模型可比专家规则减少更多的外呼量,呼叫准确率显著提高;在使用模型的情况下,智能营销场景理财产品营销响应率和基金产品营销响应率均显著提高,可覆盖更多目标营销客户。
在GPU技术研究方面,深入研究GPU工作原理及CUDA底层实现技术,并将其运用到金融计算密集型场景,涉及蒙特卡罗模拟计算的资本压力测试性能提升15倍;将其运用到大数据处理中提升3倍查询性能。后续将建设GPU服务云,为机器学习平台及其它金融密集计算场景提供计算资源。
在自然语言处理方面,深入研究语义分析相关技术和产品,并将研究成果应用于手机银行语音导航、转账要素识别等智能客服场景,以及运管查询查复场景,进一步提升智能客服的智能化服务水平,降低运管人力资源成本,后续将基于机器学习平台构建自然语言处理相关服务(如图4所示),实现智能客户机器人等垂直应用。
在计算机视觉方面,启动OCR手写体识别研究及原型验证工作,建设业务集中处理影像字符识别场景原型,大小写金额建模优化后,识别率达90%以上。后续基于机器学习平台实现OCR识别技术等图像识别技术并进行服务化。
在图计算技术研究方面,通过产学研方式与清华大学和合作研究和开展Gemini高性能图计算技术及其在工商银行转账反欺诈场景的原型验证工作,将图计算挖掘的图特征作为机器学习特征的补充,提升机器学习模型的准确率,后续将图计算技术与机器学习平台对接,提升机器学习平台的智能分析和预测能力。
三、全面布局,引领技术路线新风向
展望未来,实验室将继续开展大数据及人工智能领域的前瞻性研究,以扎实的技术研究快速推进IT架构转型及应用成果转化,将服务业务、服务客户作为最终目标。
1.促进大数据与人工智能应用成果的快速转化
构建工商银行的智数市场,形成成果展示、经验交流平台、以及数据和能力复用与输出的生态体系,促进全行大数据与人工智能的运用,并为各合作方赋能。
2.提供面向业务可感知、可使用的大数据与人工智能服务
实现以大数据规模进行机器学习、从边到边缘的基于容器的AI部署,快速、横向扩展的协作式试验,基于Spark、Docker、TensorFlow、Caffe等框架实现支持AI的数据整理。用户可使用无服务器的拖放开发模式和无代码的直观试验在几分钟内完成Web服务部署。
3.提供自主可控的智能服务
构建OCR识别、客服机器人、自然语言理解等服务体系。推出识别率在90%以上的英文和数字OCR识别服务,并基于业务集中处理中心凭证核对场景试点,力争将双人手工核对模式提升为一手工一机器核对模式,将凭证核对工作的人力投入减少一半;完成自然语言人机交互技术在智能客服领域的试点应用,以优化和完善工商银行智能客服体系。
(文章来源:《中国金融电脑》杂志)
扫码即可手机
阅读转发此文