• 快捷搜索
  • 全站搜索

开源数据库在保险行业的应用实践

2016-03-21 16:39:43作者:阳光保险集团信息技术中心 祁晓勇 熊志高编辑:金融咨询网
在互联网金融产品的构建中,数据库系统为其提供了有力的支撑。本文聚焦于保险业IT系统中开源数据库的使用,探寻开源数据库在保险业的应用实践。

互联网思维、互联网化是时下最时髦的词汇。互联网思维已经深入渗透到各个领域,余额宝等各种宝宝类的互联网产品已吸引了整个社会的眼球。在这些互联网金融产品的构建中,数据库系统为其提供了有力的支撑。本文聚焦于保险业IT系统中开源数据库的使用,探寻开源数据库在保险业的应用实践。

一、保险业务发展对IT系统的挑战
  
  保险业务开展方式及核心业务流程在过去很长一段时间内相对比较固定,业务响应时间对系统的要求相对不太高,系统的数据结构相对变化不大,数据的增长量相对可控。随着保险的业务规模和业务模式的发展和转变,保险业对IT系统提出了更高的要求,主要包括以下几个方面。

  1.数据库架构的可扩展性。过去大而全的构建在一套数据库上的核心系统是传统业务及技术条件下的产物,在目前业务互联网化的背景下产生了诸多问题。集中的数据库系统只能向上升级硬件来保证互联网方式的业务访问,一旦访问量超过硬件能负载的最大值,就会因为某些功能不可用,导致整个保险业务系统全部不能对外服务,影响面非常大。集中式的数据库架构在扩展性方面已不能满足业务需要。

  2.数据结构的灵活性。传统保险应用系统大部分采用关系型数据库进行数据存储。关系型数据库的数据结构调整对应用系统运行及库间的数据同步等诸多方面产生影响。互联网化保险业务的特点决定了保险系统的数据结构应具有较高的灵活性。不仅是关系型结构化数据,非结构化数据越来越多地成为主流,这对基于关系型数据库的应用系统的稳定运行提出了严重考验。

  3.数据规模爆发式增长。近年来,国内保险的业务量每年都以两位数的幅度增长,数据规模的增长幅度几乎是爆发式的,现有数据库的数据规模支撑能力几乎已经达到上限。由于各种历史原因,现有数据库的水平扩展能力相当有限,为了满足业务发展,只有频繁地对现有数据进行转移。这种转移对数据的安全性保障及系统运维的难度提出了更高要求,是产生IT事故的高风险环节。

  4.业务响应时间的快速性。随着保险市场环境的发展变化,产品发布等业务环节变得更加快速。现有的业务系统上线新产品需要较长的开发周期,IT系统已经对业务的发展形成了比较大的制约。

二、开源数据库如何助力保险IT系统的建设

  1.应用事务型开源数据库。在保险业务互联网化的背景下,IT系统为保险企业提供客户信息、客户保单等数据的处理功能及各种交易报表功能,为投保客户提供快速访问保单信息、购买保险产品及快速理赔等功能。这些功能在数据处理上具有事务一致性的特点。

  (1)基于成本的选择。为了提高数据库系统的性能,商业数据库系统通过扩展设备性能的方式所付出的硬件购买和软件许可总成本是企业所不能承受的负担,严重吞噬了企业经营的利润。开源数据库提供了接近商业数据库的计算能力,采用廉价的PC Server的硬件方案,其成本不到传统模式的一半,却能提供几乎一样的数据库服务。

  (2)基于交易模式的选择。保险行业与银行业在应用数据库系统方面相比存在很大区别,银行业的系统都是短交易,短事务为主,必须要保证数据库事务强一致性,而保险行业的应用主要是以流程管理和业务处理为主,实际的一致性要求没有银行高。在这种情况下,通过应用系统对开源关系型数据、内存数据库和缓存数据库的综合使用,提供最终一致性的服务,虽然在软件实现上复杂度提高了,但在海量数据写入、快速查询等方面能达到甚至超过传统商用数据库软件的性能。

  2.应用分析型开源数据库。随着保险行业的快速发展,保险行业的业务除了推出新产品和获取保费增长外,还需要挖掘已有客户价值,规避系统性风险。这些数据的来源都是系统多年运行后沉淀的各种结构化和非结构化数据。如何更好地利用这些数据,发掘最有价值的信息,是基于数据仓库或大数据分析的典型应用场景。

  传统模式的商业智能需要构建数据仓库类应用,商业数据仓库软件和实施运维投入非常可观。虽然各个保险公司都建立了企业级数据仓库,但都是基于结构化数据进行建设的,互联网化条件下非结构化数据将占据更多内容。

  随着Hadoop生态系统的逐渐成熟,结构化数据和非结构化数据都能存储在一个大的分布式系统平台中,并且通过构建Map Reduce的相关数据挖掘算法进行数据分析,为保险业的商业智能提供了可行的解决方案,且成本低廉。

三、基于开源数据库的应用探索

  1.个意险数据分拆转存。个意险系统是面向个人短期有效的意外险保单新契约业务。个意险业务经过近3年的发展,现存保单数量8000万左右,根据去年的业务情况估算,今后每年的保单增量至少有4000万。目前使用Oracle进行数据存储,当数据达到亿的数量级时,系统的运行效率显著降低。因此,很容易预见到系统运行将遇到的瓶颈,对业务的正常开展将会产生非常不利的影响。通过对业务特点分析的结果可以发现,绝大部分数据自产生起一年后会成为历史数据,这些数据活跃度很低。因此,把这部分数据转移到MySQL数据库,并针对转移的数据开发专门的历史数据查询服务。实践结果表明,此系统的建设节约了大量的软件授权成本,同时提供了性能良好的系统功能。

  2.基于大数据平台的尝试。保单信息是保险业务系统中最核心的数据。随着公司业务的发展,保单信息数据不断累积,数据量不断增大。当前保单信息保存在核心系统的0racle数据库中,由于数据量较大,保单信息查询功能的响应速度受到一定影响。考虑到保单信息数据量的增长状况,我们决定尝试在HDFS+Hbase的数据存储架构上存储保单信息,并在此基础上开发保单信息查询功能。实践结果表明,此平台能够提供高性能的数据查询服务,平台搭建涉及的所有软件都是开源免费的系统,通过极低的软件使用成本获得了较高的系统处理能力。

四、深入应用开源数据库的措施

  开源数据库在很多企业及业务场景下已经得到了大量的应用,使用开源数据库可以带来可观的经济效益,同时也必须客观地认识到还存在一些需要正视的问题。因此,保险业在如何更深入地应用开源数据库方面必须做好以下几方面。

  1.宣传实践案例的示范效果。随着开源技术的实践案例越来越多,这种示范意义将是巨大的。开源软件的价值是毋庸置疑的,在互联网行业已经被验证可以高效稳定地运行。如果在保险行业渐进式地实施开源数据库的应用,将逐步改变对开源数据库在认识上的偏差,提高使用开源数据库的信心,给整个公司带来更多收益。

  2.充分评估风险。由于开源产品基本都是免费产品,产品开发团队很可能产生很大的波动,导致产品开发的连续性难以保障,出现高版本不兼容低版本的情况。另外,在安全性、稳定性等方面都存在很大风险。目前,开源数据库的商业运用已经有了很大发展,但其所支撑的业务系统都有小、稳定性要求不高的特点。说明大家在稳定性要求高的环境中使用开源数据库还是非常谨慎的。因此,在使用开源数据库时要充分考虑业务系统的稳定性需求。

  3.加大人才培养力度。保险行业对开源技术的认可和开源技术人才的培养是相辅相成的关系。IT部门越是认可开源技术,技术人员在架构设计和系统开发中越是敢于大胆尝试开源技术,更有利于技术人员在使用开源技术方面的能力成长。最终使得越来越多的技术人员在熟练应用开源技术后,反过来促进保险业IT更好地使用开源技术。
  
(文章来源:《金融电子化》杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章