- 快捷搜索
- 全站搜索
近年来,随着我国经济的持续快速发展、国民收入水平的提升和国民财富的积累,保险行业也得到了快速发展。然而许多保险公司在发展中采用了单纯扩张业务规模的策略,并未对客户和准客户进行分类分级管理,也不注重研究不同类别和不同级别的客户能为保险公司带来的现金流价值和业务价值,对不同的客户平均使用费用成本,致使业务成本较高,保险公司赢利能力较低。保险行业急需引进科学的客户价值分析方法和客户分类分级方法。
数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database),简称知识发现(KDD)。它是从大量的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的、但又是可信的、潜在的和有价值的信息和知识的过程 。数据挖掘技术从诞生到现在已有20多年的历史,目前被广泛应用于商业领域,主要用于帮助企业进行产品研制、生产过程控制、市场营销推广及客户关系管理等。具体到保险行业,利用决策树、回归分析、时间序列模型、神经网络、聚类、关联等算法,通过客户数据挖掘可帮助保险企业进行诸如客户细分、营销响应、交叉销售、客户流失预警和客户挽留、保险欺诈识别等诸多主题的分析。
本文应用数据挖掘技术,以某寿险公司实际的海量数据为例,进行了寿险个人客户现金流价值和业务价值的专题研究,有三方面的实际意义:一是理论联系实际,用数据挖掘的方法研究寿险个人客户的基本情况,得出科学结论,并提出寿险个人客户分类分级方案和客户分类分级应用的具体政策建议;二是提出其它支持寿险个人业务发展的政策建议,以提高保险公司经营效率,促进保险销售从传统人海销售、地毯销售转向科学销售的转变;三是可以验证数据挖掘技术在保险行业的适用性,推动数据挖掘技术在中国保险行业的应用和推广,助力中国保险行业转型升级,打造保险业竞争优势新源泉。
基于CRISP-DM方法论的数据挖掘
跨行业标准数据挖掘方法论CRISP-DM(Cross-industry Standard Process for Data Mining)是数据挖掘业界通用标准, CRISP-DM将数据挖掘分成六个阶段:商业理解、数据理解、数据准备、建立模型、模型评估和模型发布。它强调的是数据挖掘在商业中的应用,解决商业中存在的问题,而不是把数据挖掘局限在研究领域 。一般统计研究重视假设检验,相反数据挖掘重视实践检验。
(一) 商业理解
明确要达到的业务目标,并将其转化为数据挖掘主题。本数据挖掘的业务目标是:分析寿险个人客户的分布概况,建立数据挖掘模型,计算寿险个人客户的现金流价值和业务价值,提出寿险个人客户的分类分级建议和差异化服务建议,支持寿险业务的又好又快发展。
(二) 数据理解
找出可能的影响主题的因素,确定这些影响因素通过哪些数据体现,这些数据存储在哪些系统中。
1、数据来源和提取
为进行本次分析,我们提取了某寿险公司开业至2010年11月30日全部个人客户投保人的性别、出生日期、婚姻状况、学历等基本信息,以及这些个人客户投保人购买某寿险公司产品的保单号、险种、交费年期、渠道、缴费方式、起保日期、终保日期、首年保费、总保费及该保单的投保机构等信息。按上述条件,我们共提取了寿险总保单量6405233,这些客户是以下分析的基础。
2、寿险个人客户整体状况
1)客户的性别分布
寿险个人客户男性占比45.56%,女性占比36.68%,仍有17.75%未知性别。
2)客户的年龄分布
将客户年龄段大体分为:0-18、19-25、26-30、31-35、36-40、41-45、46-50、51-55、56-65、65以上、其他(包括年龄为负值、为空等情况),其分别情况为:
寿险个人客户较均匀分布于19岁50岁,仍有17.76%未知年龄。
目前Hadoop/HBase广泛应用于各类具有大数据需求的企业,尤其是互联网企业,
工商银行启动业务集中处理改革,研发了具有自主知识产权的业务集中处理平台