• 快捷搜索
  • 全站搜索

大数据分析在保险公司运营流程中的应用

2016-11-11 14:20:50作者:中国人寿保险股份有限公司研发中心 张新宇编辑:金融咨询网
随着业务管理的逐渐精细化,保险公司诸多业务的规则与条件越来越复杂,运营人员掌握起来难度很大,而且效率较低。本文从保险公司业务运营的实务出发,分析大数据在这些实务中的应用场景以及能够产生的价值,对大数据在运营流程中起到的作用进行初步探索。

保险公司的运营涵盖从新契约、核保定价、保全、理赔以及客户服务等诸多业务环节。随着移动互联网和大数据等技术的不断发展和应用,各个业务运营环节都逐渐呈现了集约化和智能化的特点。一直以来,这些业务环节都需要基于大量的规则来进行风险判断,各保险公司的核保或者核赔指引通过大量的表格和公式来给运营人员提供各种决策的参考依据。这些表格和公式往往都是基于大量的历史统计数据和经验得出的结论。

  随着业务管理的逐渐精细化,这些规则与条件越来越复杂,运营人员掌握起来难度很大,而且效率较低。在本文中,我们从保险公司业务运营的实务出发,分析大数据在这些实务中的应用场景以及能够产生的价值,对大数据在运营流程中起到的作用进行初步探索。

一、运营流程的决策及依据

  我们以新契约核保、理赔两个环节为例,分析其决策所需要的依据。

  1.核保环节

  在收到一个投保申请后,保险公司依据投保申请所填写的内容进行核保。依据计算机系统中所设置的核保条件,如果符合自动核保要求,则自动通过或者直接拒保;若需要人工介入,则进入人工核保过程。对于部分风险较高的业务,则需要转入级别更高的人工二级核保流程进行人工审核。在此过程中,核保引擎通过计算机系统中配置的规则进行判断并得出自动核保结论。

  这些规则往往基于历史统计结果进行设置。以车险为例,核保过程中可能涉及的因素包括:业务来源,4S店/其他代理/电销等;车辆使用性质,家用车/营业用车/特种车辆;续保/转保;车辆年限、车型、新车购置价等;历史投保的险种;历史赔付率。

  基于这些因素,核保引擎做出判定该投保属于标准件(风险较低)或非标准件(风险较高)。对于运营效率而言,如果规则设置的较为严格,则非标准件比例会比较高,需要人工核保的量会很大,导致运营效率较低;如果规则设置的较为宽松,则风险将增加。

  2.理赔环节

  当保险公司接收到理赔报案后,通过受理环节,收集相关的报案材料后,进入核赔环节。在核赔环节,核赔人员根据报案材料的内容,决定是否需要进入调查环节。如果需要做相关的现场调查,则进入人工调查环节。与核保环节类似,是否需要进入人工调查环节是核赔人员依据相关的规则进行判断。

  在核赔过程中,核赔人员往往依据下面的一些内容:出险时间、地点,报案时间,出险原因,相关的证明材料及单据等。

  由于调查涉及大量的人工处理,保险公司往往需要投入大量的人力和物力进行调查。如果过多的案件都需要进入人工调查环节,则运营成本过高;如果应该调查的案件未进行调查,则可能出现欺诈等情况。

二、基于大数据的决策方法及作用

  通过前文的分析我们可以看出,核保和理赔两个环节的决策依据都是基于历史经验形成的规则来进行决策。其质量和效率往往依赖于人的经验。基于大数据的方法正是基于历史数据并结合业务人员的经验,通过相关的模型训练建立评分模型。通过定量的方法将这些模型固化在相关的核保和理赔的IT系统中,以系统评分的方式来做出初步判断。

  这种基于大数据的定量决策方法具备以下优点:决策定量化,可以将风险程度通过模型进行量化,将传统的定性决策转变为定量决策。决策精细化,传统的经验中,为了便于操作,每个规则所涉及的因素较少,因此规则的设置精细化程度不够。而大数据的方法可以基于更多的因子做出更加精细化的决策。提升运营效率,从模型实际部署的情况看,通过模型进行评分在风险水平相同的情况下,可以大量节省人工审核成本,提升运营效率。

三、详细设计

  1.智能化核保

  以车险为例,在保持风险水平不变的情况下提升自动核保率为目标来进行模型的设计。基本思路如下。

  数据基础是以投保单上的投保信息为决策可以使用的数据。针对续保车辆,以往年的理赔情况为补充。以预测该投保申请未来的赔付率为目标。不同的赔付率水平,采用不同的折扣系数。对于违反相关设定的投保申请进入人工核保环节,否则直接自动核保通过。

  (1)模型变量。在整个模型设计中,可能用到的变量包括客户信息、标的信息、历史投保信息、历史理赔信息、行为信息、风险信息等。

  在现有各个保险公司的核保过程中,更多的是参考投保单上的客户信息、标的信息以及业务来源等较少的几个变量。对于中小型保险公司,由于历史上的存量数据比较少,在投保过程中,往往比较难以找到历史数据。但对于大中型的保险公司,则可以从存量数据中寻找相关的信息,来优化核保流程。

  客户信息:包括投保人年龄、学历、婚姻状况、职业等基本信息以及与行驶证是否同一人,是否指定驾驶人之一等各类衍生信息。

  标的信息:主要描述车的信息,包括车辆识别信息(号牌底色,号牌号码,VIN码等)、车辆配置信息(ABS、气囊、拖车、是否改装等)、车辆价值信息以及车辆的使用信息等。其中车辆的使用信息最为关键,车辆用途、行驶区域等对于车险的风险有直接影响。

  历史投保信息:包括各个险种的保额、保费、折扣等信息,以及基于这些信息衍生的各类比例。在此信息中,不但要分析最近1年的,也要考虑最近3年及历史累计情况,所以会产生大量的衍生变量。

  历史理赔信息:历史上该车的理赔信息,除事故类型、出险时间、报案时间等基础信息之外,理赔与保单起始日及结束日之间的天数,等大量的衍生信息也会在判定风险中发挥较大作用。

  行为信息:历史投保中的保单行为上的数据,包括批改、退保、转保、投保渠道、更换投保渠道等行为都能够从某些侧面反映投保人的风险水平。

  风险信息:风险信息往往是保险公司根据相关的业务策略对客户所做的一种概括,比如黑名单、特殊人群、是否曾经拒赔申诉、是否高保额投保以及车辆易手次数等。

  (2)模型设计。在整个模型设计中,我们以历史数据为基础,将上述所有信息作为变量,将风险水平作为预测目标。在左右数据中,赔付率是最能够体现风险水平的一个指标。该设计模型的思路是以前面分析的变量来预测赔付率(如图1所示)。

图片1.jpg
图1 预测模型设计方法

        用历年的数据形成整个模型训练的数据,用投保前的历史数据来预测投保后1年的赔付率。模型训练的结果用来对未来的投保单进行评分,预测该投保申请未来1年的赔付率。以决策树算法来建立整个模型,如图2所示。

图片2.jpg
图2 赔付预测模型结果示意图

   依据模型训练时各个变量与目标变量(赔付率)之间的关系,算法将生成一颗类似图中所示的决策树。图中的数据并非真实的生产数据,我们仅以此作为例子来说明该模型的作用。在所有客户平均赔付率为64%的情况下,某一个特定的客户群组,其赔付率可能超过200%,如图中所示无指定驾驶人并且年行驶里程超过5万公里。

  通过这种自动的方法,在上百个变量的情况下,通过模型自动计算也会从中分出赔付率高、中、低等群体。对于模型生成的结果,我们可以将其以规则的形式固化在核保引擎中,以此来进行风险判断。

  (3)模型实践。在某个财产险公司的实际应用中,设计的变量超过500个,通过初步变量筛选选定与赔付率关系密切的变量超过30个,并以这30个变量来进行模型的训练,将最终的模型应用到核保引擎中。在保持风险水平不变的情况下,自动核保率提升7~10个百分点。从而降低整体人工核保的比例,能够在提升运营效率的同时降低核保时间,提升客户满意度。

   2.智能化理赔

   智能化理赔的思路是通过在核赔引擎中加入大数据分析引擎,通过分析引擎来判断该报案存在欺诈的可能性。对于欺诈可能性低的报案,则无需进行人工调查;而对于欺诈可能性较高的报案,则需要进行仔细的人工调查。通过这种方式,可以达到两种目的。一是降低欺诈的比例;二是降低人工调查的数量,提升运营效率。

  (1)模型变量。我们依然通过车险理赔报案来进行智能化理赔的介绍。在该模型设计中,所涉及的变量可能包括下面几种不同类型。

  案件相关的情况:包括出险的时间、出险的地点、责任类型、损坏类型等信息。出险时间往往还可以衍生出各种不同的类型,比如将时间转化为夜间、上下班期间、上班时间,或者按照日期分为节假日、工作日等。

  车辆相关情况:包括车龄、车价、行驶里程、二手车/一手车等信息。

  投保人、被保险人等相关人员的情况:包括年龄、性别、婚姻状况等信息。同样,基于这些基础信息,可以衍生出相关的变量,比如投保人与驾驶人是否同一人,投保人与车主是否同一人。

  购买保险产品的情况:包括保险种类、保额,以及衍生出的每个险种所占的比例等信息。

  车辆过去的理赔、欺诈等行为:包括历史的理赔次数、累计理赔金额、拒赔的情况等。

  (2)模型设计。通过上述变量,我们分析其与欺诈之间的关系。随机选取历史上已经结案的报案信息进行人工整理和分析,确定该报案是否属于欺诈。再通过模型得到欺诈与上述变量之间的关系,从而可以如同核保一样建立起理赔欺诈预测模型。与智能化核保设计模型的思路相同,我们用历史数据来建立模型。最终将模型部署到核赔引擎中,通过模型评分来确定欺诈风险较高的报案,进行现场查勘,如图3所示。

图片3.jpg
图3 理赔申请欺诈预测模型结果示意图

  图3为采用决策树算法构建的一个模型示例,通过该模型可以将所有的报案进行评分。对于评分值较高的报案采用现场查勘的方式,而对于评分值较低的报案则采用直接进行线上操作完成后续流程。

  (3)模型实践。在某财产险公司的实践中,通过人工审阅的方法审阅了17万个案卷,其中有3300多个存在欺诈的理赔案件。基于这些数据,构建了整个决策树模型。在模型训练中,从300多个相关的变量中,选择了十几个与欺诈率关系较高的变量最终构建模型。通过模型的部署与应用,同时实现了赔付率降低、运营效率提高以及欺诈比例降低三个目标,取得了非常好的效果。

(文章来源:《金融电子化》杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章