• 快捷搜索
  • 全站搜索

“全息数据”技术在反洗钱应用领域的探讨

2017-09-21 16:18:11作者:中国反洗钱监测分析中心 张煜 孔繁颖编辑:金融咨询网
作为金融行业的监管者,国家反洗钱数据库接收的金融机构交易数据量随之大幅增长,每天监测的交易数量屡创新高,在海量数据中准确识别可疑主体的难度增大,如何有效驾驭大数据,已成为推动反洗钱工作未来发展的关键因素。

随着中国经济的高速发展,以大数据、云计算、区块链为代表的金融科技正在金融行业得到深入应用。金融业对数据的计算能力大幅度增强、信用评价能力取得突破进展、风险管理有效提升。金融机构业务能力的增强促使其提供服务的种类、速度、效率高速发展,每天产生的交易数据量也在持续增长。作为金融行业的监管者,国家反洗钱数据库接收的金融机构交易数据量随之大幅增长,每天监测的交易数量屡创新高,在海量数据中准确识别可疑主体的难度增大,如何有效驾驭大数据,已成为推动反洗钱工作未来发展的关键因素。

反洗钱已成为大数据应用的重要领域

        大数据及大数据技术受到人民银行科技部门的高度重视,反洗钱数据库管理的交易数据存量大、增速快,面对金融业大数据潮流的冲击,有发展大数据应用的基础和需要。反洗钱新一代数据处理平台在设计时即采用前沿的大数据技术架构,以高性能数据处理平台为核心,通过采集金融机构的交易数据、权威机构共享的人员数据、外部机构提供的社会数据,来构建反洗钱领域的基础大数据,充分发挥大数据在反洗钱可疑主体分析方面的价值,形成卓有成效的创新体系。

建设反洗钱领域的大数据应用——全息数据

        1.应用大数据技术建设反洗钱全息数据。

        反洗钱全息数据是指待分析主体全方位信息的立体展现,即通过先进的大数据技术,采集交易行为、金融信息、社交信息、征信信息、身份信息等大而全的主体数据,建立可全面描述主体特征的资料库,使得反洗钱工作者更完整、精确地对主体活动的情况进行分析。主体全息数据的收集与建立,有助于反洗钱工作者使用数据挖掘算法、网络分析技术、文本识别等一系列前沿的大数据处理技术,从中发现从前没有或者不可能发现的犯罪行为,使反洗钱从“经验主义”的模糊分析方式迈向“数据驱动”、“主体画像”的精准治理方式。预测主体洗钱行为的活动周期,掌握主体的社会关系、现实生活状况,实现集中有限资源打击重点洗钱人员及上游犯罪。

        2.应用全息数据提升调查分析主体的能力。

        首先,反洗钱数据库按照法律规定接收13类金融机构的大额和可疑交易数据,并在以往的监测分析业务中积累了巨大的案例数据。可通过对银行提供的主体地址、联名账号、职业等数据,以及保险提供的主体受益人、被保险人数据,证券提供的主体股东数据等进行关联,挖掘主体的社会关系网络。对主体转账、汇款数据、电话数据等往来信息进行关联分析,监测资金在不同主体之间的流动情况。

        其次,反洗钱工作从国家反洗钱战略高度出发,打破各执法机关的数据孤岛。积极利用政府公开与非公开的数据库,收集主体全方位的真实生活数据,通过对主体的违法犯罪数据、工商税务数据、家庭户口数据,甚至交通与住宿数据的关联分析,发现主体自身的社会属性与活动情况。

        最后,在扩大数据来源方面突破传统界限。与电商公司、社交公司、征信公司、媒体公司等参与社会数据采集与分析的机构建立可靠的数据使用机制,实现数据资源的有效整合,建立更加完整的主体全息数据。并可通过对主体社交媒体数据、消费偏好数据、地理位置数据等信息进行分析,全方位展现主体在现实生活中的行为特点。

        3.将非格式化数据纳入反洗钱全息数据中。

        预期未来三年,虽然结构化数据能够基本满足反洗钱数据库的业务工作需要,且仍然是反洗钱数据库核心业务系统最主要的数据资源。但是,以非结构化为主要特征的大数据作为传统数据的重要补充,将逐渐被反洗钱数据库接收和使用,重要性逐步增加。因此,未来反洗钱数据库将以交换、交易和查询的方式从政府部门、公共事业单位或其他企业获得海量的非格式化大数据。在逐步具备存储非结构化数据的基础上,更要发展能同时分析结构化和非结构化数据的计算能力,更好地对金融业可疑主体的交易行为进行监测,在金融业大数据应用的初级阶段掌握主动权。

基于反洗钱全息数据构建主体画像

        1.反洗钱领域的主体画像。

        基于复杂、异构、多源的反洗钱全息数据,如何从中提炼出有价值的分析结果,并用合适的方式展示出来,是反洗钱大数据应用的价值体现。目前金融行业主要的数据分析方法、数据挖掘工具还是基于传统的柱状图、折线图、统计报表等二维或三维数据模型,满足不了多维度、复杂关系的数据模型需求。为将反洗钱全息数据库中管理的主体全息数据立体、多维、可视化呈现出来,需要构建主体画像。

        主体画像是基于反洗钱全息数据,使用全息数据中的主体社会属性、生活习惯和交易行为等信息抽象出来的一个标签化的主体模型。构建主体画像的核心工作是建模,通过模型运算多维度还原主体真实的社会背景,提炼出主体在多个方面的特征标识,并给主体贴上更加精准和立体的画像“标签”,及时有效地识别和锁定可疑主体或群体,避免潜在的金融风险及洗钱行为。

        2.构建反洗钱领域的主体画像。

        使用反洗钱全息数据抽象主体画像,主要在于利用数据挖掘、机器学习等工具对全息数据进行深入的转换、挖掘、分类、预测,构建主体洗钱行为监测模型。可视化方面可以通过社区挖掘算法识别多种群体洗钱行为模式,使得反洗钱主体画像可以用于宏观洗钱风险分布、洗钱风险趋势分析和可疑主体排名。

图片1.jpg
图 全息数据画像建模

        如图所示,基于反洗钱全息数据构建主体画像可分为四个步骤。

        (1)数据收集。数据收集大致分为网络行为数据、平台服务数据、主体社会活动数据、主体交易数据四类。其中网络行为数据主要包括全域互联网行为、行为数据采集、社交数据等;平台服务数据包括千万级黑名单、第三方征信、电信运营商管理的数据、央行征信报告、微博、申请材料图片等;主体社会活动数据主要包括工商/法院数据、企业社保数据等;主体交易数据主要包括金融机构交易数据、第三方支付机构借贷与交易数据、其他流水数据等。一般情况下,保存主体交易行为、社会行为数据时,该行为发生时所处的场景数据也是反洗钱全息数据的一部分。

        (2)数据处理与AI分析。在数据收集后,需要对收集到的数据进行ETL处理,并作为格式化和非格式化数据存储在反洗钱大数据平台中,通过模型的学习、反馈调优、运算,以提炼、预测出每个主体的特征、类别和趋势。这个建模过程是主体画像的关键步骤,大数据的价值高低主要由建模方法的优劣来体现。目前关于洗钱行为建模有很多研究成果,例如神经网络、支持向量、马尔科夫链、主成分分析、聚类分析、决策树等数据挖掘和机器学习算法,为了更好发挥各类建模算法的优点,给主体贴上合适的画像标签,通常的做法是综合使用多种算法来构建洗钱行为模型引擎。

        (3)建模引擎。在数据处理和计算完成后,需要结合全息数据进行一个全方位的建模分析,要把主体的基本属性、交易方式、行为特征、兴趣偏好、社交网络、外部评价等综合标签化,标签一般采用多层标签、多级分类。受限于数据来源及数据质量,主体画像永远无法100%地刻画真实社会中生活的主体,但可以做到根据持续更新的主体全息数据不断地接近真实的主体。因此主体画像不但要要根据变化的数据不断更新,还要根据新的数据类型抽象出主体新的标签,使得主体画像更立体更真实。

        (4)主体画像可视化分析。基于标签化的主体画像,使用可视化分析方法,可以在一个网络群体中,根据主体画像的可疑度展示出核心犯罪份子、评估某群体潜在的洗钱犯罪类型,以便反洗钱工作人员针对性调配资源进行线索分析。主体画像可以从多维展示主体全方位的交易网络信息和社会角色,使得反洗钱工作人员快速了解主体的整体情况。例如使用模型引擎中的聚类算法计算主体的支付画像标签,将某地区喜欢使用第三方支付工具的主体按年龄分组,可以查看不同年龄人的支付偏好,为地区洗钱风险评估提供依据;而利用时序分析与社会网络分析方法算法,使用主体的个人属性、交易行为、社会活动时序、社会关系网络化数据,来计算主体的交易行为与交易角色两个画像标签。可以综合判断是否有主体具有可疑的洗钱行为,并形成可疑度排名,减少反洗钱工作人员发现洗钱犯罪人员的成本。

建设反洗钱全息数据需要关注的问题

        1.数据交易的法规体系尚不完善。

        目前,包括反洗钱中心在内的金融行业对个人和企业数据需求的广度和深度迅速增加,而清晰的产权归属是交易的前提与基础。我国缺乏数据产权归属的明确规定,相关法律只是明确了任何组织机构不得非法获取、出售和非法提供公民电子信息。随着互联网的发展,人民对个人信息使用的观念也在演变之中,理论每个人对个人的数据具有财产权益,可以享有、占有、使用、收益、转让或处分个人数据。另外,由于政府、公司对于其提供的信息化服务或履行信息化职责中获得个人数据享有使用、分享、交换、转移、删除数据的权利,特别是对数据的记录、存储投入了巨大的科技、人力成本,一定程度上具有匿名数据集的所有权。因此需要在法律规则层面明确个人数据权重的财产权益与使用范围,以此促进大数据市场合法合规的使用、交易数据,降低金融业使用数据的限制标准。

        2.数据计算能力的挑战。

        在信息化建设快速发展的今天,海量的数据使得传统的数据计算平台达到承载力上限,对大数据时代多维度、大容量的数据处理更是捉襟见肘,无法充分发现数据中蕴含的价值。因此,需要不断加强反洗钱领域金融与科技人才队伍建设,持续利用大数据领域的最新技术来推动反洗钱监测分析工作的创新,建设能够支撑反洗钱全息数据库的大数据计算平台,满足国家打击洗钱及其上游犯罪的需要。

        3.数据安全保障问题面临巨大挑战。

        保护数据安全是金融行业面临的巨大挑战。反洗钱数据库在信息化建设中高度重视数据安全,并投入大量资源从技术和管理两个方面持续完善自身的信息安全保障体系。但数据安全是一个系统工程,需要法律体系、制度、管理体系和技术标准等多方面的支持。当前没有形成完备的国家和行业数据安全保障体系,仅靠反洗钱中心的力量协调各数据提供、共享单位建立数据交易、交换渠道,难以保证数据安全,尤其是难以保证数据交换中的安全。我国的《网络安全法》近期初次发布,但就如何维护网络安全和数据安全还有待进一步规范和加强。法定责任范围不明确和安全标准缺乏不仅增加了企业安全投入,降低了效率,甚至导致与有些第三方企业的合作无法展开。

合理使用全息数据的政策建议

        1.切实加强全息数据应用基础环境建设。

        建设反洗钱领域的全息数据库是一个渐进的过程,即要借鉴反洗钱数据库的建设经验,同时要参考金融行业大数据应用的发展思路,立足于反洗钱监测分析业务自身发展趋势与技术特点,定制化建设具备反洗钱反恐怖融资特点的全息数据平台,分阶段逐步迁移现有业务系统和数据,坚持应用推动,讲求实效。

        2.逐步完善反洗钱数据的信息安全和隐私保护工作。

        反洗钱工作中,主体全息数据的使用、交换、共享中要明确参与者的责权划分,建立相应的安全认证体系;要切实保障金融数据交换的安全,解决好数据流动中的安全保障,防范数据泄露、数据篡改、数据丢失而造成的安全风险;要明确使用数据的隐私保护范围,特别是对外部共享渠道、交易渠道收集的政府事业单位数据、商业数据、个人数据使用的限定,避免数据使用超出规定权限。

        3.加强与执法部门的合作,提高数据使用价值。

        由于我国社会信息资源离散程度较高,政府和企事业单位自建的信息库又都比较封闭,与反洗钱工作相关的个人和机构数据分属多个部门管理,不利于主体数据的共享、洗钱犯罪人员立案破案的反馈。鉴于反洗钱监测分析工作的重要性,反洗钱全息数据库需要拥有较高的数据访问权限,在保密的前提下跨平台查询主体的相关数据,实现执法立案破案情况及时反馈以更新全息数据库,建立有效的反洗钱信息系统联合座席制实现主体数据的共享。

(文章来源:金融电子化杂志)  

扫码即可手机
阅读转发此文

本文评论

相关文章