• 快捷搜索
  • 全站搜索

保险数据仓库建模浅析

2013-12-04 16:20:43作者:中国太平洋保险集团股份有限公司信息技术中心 杨进玉编辑:金融咨询网
保险业务模型的建立,能够帮助险企对保险业务进行全面的梳理。一方面,使得IT人员和管理人员对业务架构图和整个业务的运行情况有了全面的理解,有利于将不同业务按照特定的规律进行分门别类和程序化,另一方面,能够帮助险企进一步地改进业务流程,提高业务效率,以便于更好地指导和管理业务部门的生产。

“数据仓库之父”bill Inmon(比尔•恩门)在其《建立数据仓库》一书中定义了数据仓库的概念,随后又给出了更为精确的定义:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用系统不同的是,数据仓库更像一种过程,是对分布在企业内部各处的业务系统的数据进行整合、加工和分析的过程。数据仓库是面向主题设计的,存储的一般是历史数据;并有意引入冗余,采用反范式的方式来设计。为分析数据而服务,其基本的元素是维表和事实表;数据仓库是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。

        近年来,随着数据库技术的发展和成熟,人们尝试对数据库中的数据进行再加工,形成一个综合的、面向分析的环境,以更好支持决策分析,从而形成了数据仓库技术。数据仓库的关键仍然是数据库,以辩证的眼光来看,数据仓库的兴起实际上是数据管理的一种回归,是一种螺旋式的上升。企业级数据仓库(EDW)应当被设计成一种已在“上游”处理过的数据的标准存储器。它已经进行了清洗、转化和主数据处理,并在这里被合并成一个“记录系统”。数据标准化重构的原则是,将它从源系统单一视角中移出,放到整个企业的多角度中。

        数据仓库模型设计是数据仓库建设过程中最为复杂的任务之一,设计人员不仅需要理解大量的业务需求,还需要熟悉企业已有操作型数据源系统的数据状况。目前国外比较成熟的数据数据仓库建模方法主要以bill Inmon(比尔•恩门)推崇的数据驱动(data-driven)方法和Ralph Kimball(拉尔夫•金博尔)所提倡的业务驱动(demand-driven)建模方法为主。前者关注数据源系统数据,而忽视了企业最终用户的业务需求;后者仅强调满足各个业务部门的业务需求,从而导致数据仓库逻辑模型可能难以满足整个企业级的需要,并且,这种方法未考虑数据源问题,所以设计出的数据仓库可能会出现没有充分底层数据支持的情况。

        随着数据仓库技术的发展,为弥补上述方法中的不足,业界纷纷提出了数据驱动与业务驱动相结合的一种数据仓库建模方法,该方法主要以数据源业务特征分析为基础,即把数据源数据表(即来自企业各个业务系统的数据)基于数据仓库主题(subjects)分类,这种方法充分综合了数据驱动和业务驱动两种方法的优点,可以把数据源系统的数据与企业用户的业务需求有效结合起来。

        保险业务部门和系统繁多,数据来源也众多。企业数据仓库模型的建设将建立全方位的数据视角,消灭信息孤岛和数据差异,为企业提供一个统一的数据视图。各个部门不再只是关注自己的数据,开始关注部门之间数据的内在联系,并关注整个企业数据的一致性。另外通过数据模型的建设,能够很好的分离出底层技术的实现和上层业务的展现。当上层业务发生变化时,通过数据模型底层的技术实现可以非常轻松的完成业务的变动,从而达到整个数据仓库系统的灵活性。再者,险企数据仓库模型的建立需要对保险业务进行全面的梳理,改进业务流程。保险业务模型的建立,能够帮助险企对保险业务进行全面的梳理。一方面,使得IT人员和管理人员对业务架构图和整个业务的运行情况有了全面的理解,有利于将不同业务按照特定的规律进行分门别类和程序化,另一方面,能够帮助险企进一步地改进业务流程,提高业务效率,以便于更好地指导和管理业务部门的生产。

1.保险数据仓库建模的特点

        数据仓库是一个支持管理决策的数据集合,数据是面向主题的、集成的、不易丢失的、且随时间增长的,数据仓库是所有业务系统和外部数据源的快照集合。传统的OLTP(在线事务处理系统)系统,通常是按照应用建立模型,换言之,OLTP系统是面向应用的。而数据仓库是按照主题(Subject)来建模,不同于OLTP的系统,它并不是用来运行当前的操作和应用,而是用来分析数据并且从现有数据中发现和挖掘新的价值,主要是预测未来的情况。所以它更是一种OLAP的系统(在线分析处理系统)。所以,数据仓库建模的两个重要特点是面向主题和集成性。

        面向主题与传统数据库面向应用相对应,主题是一个在较高层次将数据归类的标准,是用户使用数据仓库进行决策分析时所关心的重点方面。每一个主题对应一个分析领域,通常与多个操作型信息系统相关。另一方面,主题域用于关注一个特定领域的业务概念,模型由不同主题域组成。保险业务的主题域可以分为关键主题域和辅助主题域等,也有精细化管理的保险公司,将主体域分级处理,构建了一级、二级等多级的主题域,来满足企业内部业务分析的需求。由于业务流程的相似性,保险业务底层主体域在各个保险公司都比较通用,如表1所示。

保险数据仓库建模浅析-表1.jpg

        集成性是指在来源复杂的数据进入数据仓库之前,必须经过数据加工和集成,消除源数据中的不一致性,以保证数据仓库内的数据是关于整个企业的一致的全局信息。在保险业中,一般都有核保核赔、核心业务、渠道管理、综意险、银保通等多种业务系统,它们都是面向应用的,所支持的交易类型简单而且固定。由于系统实施的先后等原因,这些系统可能运行在不同的平台上,相互之间没有什么关系,各系统之间的数据存在冗余。比如每个系统中都会有客户的数据,当针对险企建立其数据仓库应用时,要把上述生产系统中的数据转换到数据仓库中来。从整个险企的角度来看,其数据模型不再面向个别应用,而是面向整个保险领域的主题,比如客户、产品、渠道、协议、理赔等。因此,各个生产系统中与客户、产品、渠道等相关的信息将分别转换到数据仓库中相应的主题(主题域)中,从而在整个险企的业务界面上提供一个一致的信息视图。当针对保险业务建立起企业级数据仓库的应用时,同样产生相应的主体域(如协议、理赔、机构、财务、产品、渠道、资产等等)。

        目前业界较为主流的数据仓库厂商主要是IBM和NCR,这两家公司除了能够提供较为强大的数据仓库平台之外,也有各自的针对某个行业的数据模型。比如在银行业,IBM有BDWM(Banking data warehouse model),而NCR有FS-LDM(Financial Services Logical Data Model)模型。在电信业,IBM有TDWM(Telecom Data warehouse model),而NCR有TS-LDM(Telecom Services Logical Data Model)模型。由此可见,不同的公司针对某个行业的理解,会有不同的数据模型。

 1 2 3 4 下一页 尾页

扫码即可手机
阅读转发此文

本文评论

相关文章

频道最近更新

频道热门文章