当前位置:文档之家› 大数据征信的发展_创新及监管_王秋香

大数据征信的发展_创新及监管_王秋香

国际金融 2015-9

INTERNATIONAL FINANCE

60

大数据征信的发展、创新及监管

◎王秋香

一、大数据征信的发展背景

根据世界银行《征信行业的基本准则》(General Principle for Credit Reporting),征信是金融市场发展的重要基础设施。其根本作用是解决交易双方信息不对称的问题,进行信用风险管理。随着互联网、大数据技术的发展,有三股力量推动了大数据征信的崛起,即市场需求、技术发展和政策支持。

(一)市场需求催生大数据征信的崛起

互联网金融的发展,关键在于风险控制,而征信则是风险控制的核心。大数据征信则为互联网金融发展提供了重要的基础设施支撑。近几年来,网络借贷(P2P)快速发展,而缺少可靠、易用的征信数据则成为制约P2P 发展的重要因素。截至2015年6月底,我国共有786家网贷平台倒闭或者“跑路”,占网贷平台总量(2028家)的39%。此外,2015年国务院决定将原在16个城市开展的消费金融公司试点扩至全国,电商巨头、P2P 公司和银行

作者简介:王秋香,中国人民银行营业管理部。本文仅代表个人观点,与所供职单位无关。纷纷抢滩消费金融领域。目前,我国共有10家消费金融公司,未来数量还会增加。2014年,我国互联网消费金融市场交易规模为100亿元,2017年预计将突破1000亿元。

(二)技术变革推动大数据征信的发展

数据是征信机构的核心资产,也是征信业发展的重要基础。随着互联网、移动互联网和云计算技术的普及,数据的产生、记录和存储变得极为容易。电商数据和社交数据都可以成为信用的一部分,而机器学习、人工智能、数据挖掘等算法技术的出现,则为征信大数据海量采集和深入挖掘信用数据,提供了极大的便利,既可以统计和评估过去的信用状况,也能分析和预测未来的违约率(见图1)。

(三)政策环境支持大数据征信的发展

2013年3月国务院下发的《征信业管理条例》(下称《条例》)和2013年12月人民银行出台的《征

信机构管理办法》,放开了市场化个人征信机构的

DOI:10.16474/https://www.doczj.com/doc/466956604.html,ki.1673-8489.2015.09.013

INTERNATIONAL FINANCE 61

开设。2015年,国务院出台了多项政策,鼓励互联网金融和大数据征信健康发展,如《关于积极推进“互联网+”行动的指导意见》提出,利用大数据发展市场化个人征信业务,加强网络征信和信用评价体系建设;《关于运用大数据加强对市场主体服务和监管的若干意见》提出积极培育和发展社会化征信服务,推动大数据征信产品在行政管理、公共服务以及金融领域的应用;《关于促进互联网金融健康发展的指导意见》明确规定,鼓励从业机构依法建立信用信息共享平台,允许有条件的从业机构依法申请征信业务许可,接入央行征信系统。

二、大数据征信的发展模式

(一)基于电商平台的大数据征信

1.芝麻信用模式

芝麻信用依托于淘宝、天猫、支付宝等平台,以阿里云的大数据分析为基础,对用户在网上交易的行为数据(包括电商交易、第三方支付数据等)和支付宝的信用卡还款信息进行采集、整理、保存、加工,提供给阿里小贷或与其合作的商业银行,再经过第三方认证以及深度挖掘和评估,形成对客户的风险定价,并用于作为信贷审批决策。芝麻信用的产品包括芝麻分、芝麻认证、风险名单库等。其中,芝麻分主要从用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度评估,最低350分,最高950分。目前,阿里拥有3亿支付宝的实名用户和1.45亿淘宝用户,这些数据占到芝麻信用评分的30%—40%。芝麻分的应用场景包括酒店、租车、签证、旅游、金融、购物、社交、婚恋等领域。其中,

金融领域包括消费信贷(阿里小贷)、消费分期(天

猫分期、花呗)和P2P等。

2.京东金融模式

京东金融依托于京东电商平台和物流平台,分

析商家的销售数据、采购数据、财务数据、物流

数据以及消费者的消费记录、配送信息、退货信息、购物评价等数据,以此评定商家和消费者的信

用风险分数,为旗下金融产品(如供应链金融、京

保贝、京东白条、京汇小贷等)提供授信审批决策

依据。截至2014年,京东共有9660万活跃用户。2015年,京东金融成立了企业征信公司,并与美国ZestFinance成立合资公司JD-ZestFinance Gaia,引

入ZestFinance的机器学习技术,提供企业和个人征

信服务。其主要应用于京东金融的消费金融、供应

链金融体系;未来还将用于与P2P借贷平台的合作。

(二)基于社交平台的大数据征信

1.腾讯征信模式

腾讯征信依托于腾讯集团,运用社交网络上的

海量信息,如在线时长、登录行为、虚拟财产、支

付频率、购物习惯、社交行为等,为用户建立基于

线上行为的信用评级产品(包括信用报告和信用评分)和反欺诈产品,主要用作微众银行和其他合作

伙伴的授信审批的依据。其中,信用评分根据消费、

财富、安全、守约四大指数得出,分数体现为7颗

星星。星星越多,表示评级分数越高。腾讯征信坐

拥8.32亿的QQ账户,5.49亿的微信账户,超过3

亿的支付用户,以及微博、QQ空间和游戏等聚集

2015-9 国际金融

的庞大用户群。腾讯征信主要致力于反欺诈场景下的产品应用,包括人脸识别和欺诈测评两个产品,目前已与浦发银行、广发银行等签订了合作协议。

2.闪银(Wecash)模式

玖富旗下的闪银(Wecash)基于微信,利用移动互联网和大数据技术进行信用征集,根据用户在社交媒体、SNS社区(如微信、微博、人人网等)发布的信息,分析用户在互联网上的行为轨迹及历史信息,并结合用户自主提交的身份信息、资产信息、网银流水等资料,对没有资信数据和借贷记录的用户进行信用风险评估,提供个人短期小额贷款,如现金分期、购物分期等。其特点是:利用大数据,在线进行信用征集、信用评级、快速授信(15分钟)和个人贷款。

(三)基于同业共享的大数据征信

1.上海资信的网络金融征信系统(NFCS)

上海资信有限公司2013年推出网络金融征信系统(NFCS),主要采集并整理P2P平台借贷两端客户的个人基本信息、贷款申请信息、贷款开立信息、贷款还款信息和特殊交易信息,并向加入该系统的P2P平台提供信息咨询服务,通过信息共享,帮助P2P平台了解授信对象,防范借款人恶意欺诈、过度负债等信用风险。截至2015年6月,NFCS共接入P2P平台580家,报数机构246家,涉及81.5万借款人;借款余额392亿元,查询机构129家,累计查询158万次,日均查询5900次。

2.安融惠众的小额信贷行业信用信息共享平台(MSP)

安融惠众征信有限公司创建的“小额信贷行业信用信息共享服务平台”(MSP)于2013年3月上线。该公司为小贷公司、P2P公司、担保公司提供行业信息共享服务,旨在规避借款人多重负债,降低贷款信用风险。截至2014年末,MSP征信平台的会员达639家,采集具有民间小额信贷记录的自然人154万人,日均查询量已达1万次。

(四)基于网贷平台的大数据征信

宜信、拍拍贷、元宝铺等较大型的P2P网贷平台自建客户信用系统,并用于自身的平台业务。

1.宜信模式

宜信主要利用用户自主提交的数据(如信用报告、身份证、房产证、水电煤气费用账单、教育水平、工资单、银行流水)等传统征信数据,“宜搜”则在互联网上抓取用户的电商交易数据、社交数据和政府公开数据,以及线上线下合作机构(如小贷公司、租车公司、房屋中介等)的数据,利用机器学习、金融云平台等大数据技术,并采取实地调查审核(面审)方式,对用户的信用风险进行评估,为旗下小额信贷产品提供授信支持。宜信已有6年P2P行业的数据积累,用户已超过100万。

2.拍拍贷模式

拍拍贷利用用户提交的信息、用户线上行为数据、社交网络信息、淘宝电商平台数据和行业协会数据(NFC/MSP/网贷联盟)等数据,根据20多个信用评估模型,评估客户的信用水平,提供在线的P2P服务。其最大特点是纯线上小额信贷模式,即线上征信、线上授信和线上放贷。该平台在2014年开发了第二代征信系统,其魔镜风控系统抓取客户在互联网上的行为,从400多个维度对客户进行大数据分析,并为他们建立征信档案。征信数据主要来自平台历时8年积累的700万用户的数据以及超过50亿的数据量。

3.元宝铺模式

元宝铺在商户授权后,进入商户在电商平台上的后台账户,获取商户经营数据(如销量、流量、转化率、收藏率、客单价、回头客占比等),根据这些数据以及36个月内的行业数据,得出200多个明细指标来建立信用评估模型,形成商户的信用评估报告,并提交给资金提供方。资金提供方在报告的基础上,调取央行征信报告审核,并对商户授信放贷。元宝铺作为一个第三方电商信贷平台,连接着商户和资金提供方。商户来自天猫、京东、亚马逊、eBay、1号店、聚美优品等,资金提供方有平安银行、招商银行、民生银行、浦发银行和杭州银行等。

三、大数据征信的主要创新

大数据征信可以简单理解为将大数据技术嵌入

国际金融 2015-9

INTERNATIONAL FINANCE 62

传统征信的三个基本环节中:对海量的信用相关数据进行采集和分布式存储;对这些数据进行深入的加工和挖掘;提供更加个性化、更好客户体验的征信信息服务。与传统征信不同,大数据征信的创新主要表现在数据来源多维度、评估模型多样化、应用场景丰富化和覆盖人群扩大化方面,并由此带来征信效率的提高与征信成本的下降,进而为网络信贷、互联网消费金融发展提供基础设施服务。

(一)数据来源广谱多维

传统征信数据主要来自金融领域、电信和水电煤气账单信息以及政府公开信息,而在大数据时代,数据源更广,种类更丰富,时效性更强。大数据征信采集非传统的信贷数据,包括电商平台的交易数据、社交媒体的关系数据、P2P网络贷款信息、第三方支付的消费数据、移动APP上的地理位置信息等。这些数据可以反映信息主体的社会关系、消费偏好以及性格行为特征,有利于评估信用风险。在大数据征信的信用评估中,传统的信贷数据的比重只占40%,有的甚至不用信贷数据(见表1)。

(二)信用评估精准可预测

大数据征信之所以备受关注,就在于它的预测和决策精度可以达到85%以上。传统信用评估模型更关注授信对象的历史信息,致力于对信用历史的深度挖掘。而大数据信用评估体系更看重用户现在的信息,获取用户实时的行为轨迹,并精准预测其未来的履约能力。此外,信用评估体系基于大数据技术,不仅采用机器学习模型,还使用多维度的变量。这样,一方面可以提高信用评估的决策效率,另一方面还能明显降低风险违约率。

(三)应用场景丰富多元

传统征信主要应用于信贷领域,而大数据征信由于数据来源和信用评分的不同,可将应用场景从金融领域扩大到社会生活的方方面面,如租房、订酒店、租车、办签证、求职应聘等各种需要信用的履约场景。此外,大数据征信还能为政府监管和服务提供决策依据:政府部门可以在行政管理和公共服务领域应用大数据征信产品,及时了解市场主体的信用状况,提高政府服务水平和监管的有效性,降低服务和监管的成本。

(四)征信人群覆盖广泛

目前,中国的征信系统中有信用记录的只有3.2亿人,约占总人口的23.7%,远低于美国征信体系85%的覆盖率。这意味着还有8亿人没有信用记录,无法获得传统的金融服务。而中国有6.48亿网民,其中,手机网民5.94亿,人群覆盖面非常广。而通过对网民在网络上留下的痕迹(如交易数据和社交数据)进行数据挖掘和分析,对其信用记录进行有效补充,就可让更多在互联网上有数据的人得到金融服务。

四、大数据征信给监管带来的挑战

大数据征信主要从线上采集非金融的数据,并依赖于机器学习等算法进行信用评估,为没有银行信贷记录的人群提供征信服务,是对征信业务的创新。然而,大数据征信在带来创新的同时,也给征信监管在以下方面带来了挑战:信息主体的隐私权、征信业务的合规性、算法模型的有效性以及征信机构的独立性。

传统信用风险评估体系基于大数据的信用风险评估体系

代表企业FICO ZestFinance

服务人群有丰富信贷记录的(约占85%)缺乏或无信贷记录的(约占15%)

数据格式结构化数据结构化数据+大量非结构化数据

数据类型信贷数据信贷数据、网络数据、社交数据

理论基础逻辑回归机器学习

变量特征还款记录、金额、贷款类别传统数据、IP地址、邮箱姓名、填表习惯等网络行为

数据来源银行提交给第三方的数据和银行当地数据第三方(如电话账单和租赁历史等)和借贷者本身提供的数据

变量个数15—30(变量库400—1000)多达几千到一万个

表 1 传统的信用风险评估体系和基于大数据的信用评估体系的比较(以美国为例)

资料来源:刘新海和丁伟《大数据征信应用与启示——以美国互联网金融公司ZestFinance为例》

2015-9 国际金融

INTERNATIONAL FINANCE

63

(一)信息主体的隐私权

目前,我国尚未制定有关个人信息保护的专门法律,个人隐私很难界定。根据《条例》的规定,“个人的宗教信仰、基因、指纹、血型、疾病和病史信息”等禁止采集;资产类的信息,包括个人收入、存款、有价证券、商业保险、不动产和纳税额等信息,必须得到充分授权才能采集;其他一些信息则没有明确规定。这就导致了三个问题:一是社交数据算不算个人隐私;二是信息的过度采集会不会侵犯个人隐私;三是数据清洗能否保护个人隐私。

1.社交数据是个人隐私吗

在欧美,社交数据在信用评估中的应用已经有了理论上的支持,然而却没做起来。其原因是:多数征信机构害怕受到隐私保护者的攻击,因此放弃了使用社交媒体数据来进行信用评估和欺诈验证。在2012年,德国最大征信公司夏华(Schufa)准备从社交媒体采集数据,用以评估消费者的信用状况,但因引起了公众的极大反响,最终计划搁浅。

2.信息的过度采集会不会侵犯个人隐私

互联网时代,个人在网上沉淀了海量的信息,数据挖掘和分析技术让许多与信用相关的信息变得有价值,即所有的数据都是信用(ZestFinance)。这扩大了信用信息的边界,也带来了信息的过度采集。征信机构很可能在商业利益驱动下利用网络爬虫技术从网上抓取各种信息,并用于征信以外的其他目的。在个人缺乏网上信息保护意识且未被告知的情况下,这就可能构成侵犯个人隐私。

3.数据清洗能否保护个人隐私

大数据征信机构宣称对数据进行了清洗和处理,不会再显示敏感信息。而美国的研究表明,即使经过匿名化处理的数据,仍然可以追溯至具体的个人。可见“清洗”不等于“脱敏”,如果以“是否能够直接识别”为标准,其不足以保护用户的隐私。

(二)征信业务的合规性

在大数据征信中,如何取得信息主体的书面授权、如何保障信息主体的知情权和异议权,都尚无相关法律、法规予以明确说明。这对大数据征信的监管构成了挑战。

1.采集和使用个人信息需取得信息主体的书面授权

《条例》明确规定“采集个人信息应当经信息主体本人同意,未经本人同意不得采集”。这比美国《公平信用报告法》对信息采集的要求更严格。腾讯征信放弃了采集京东的数据,主要原因在于,难以获取用户的授权。此外,在互联网时代,只要个人登陆网站,就会留下轨迹,互联网企业就可能在信息主体不知情的情况下完成对其信息的采集。还有一些网站在给用户提供免费服务时,要求用户必须提交基本信息。

《条例》还要求:“信息使用者应当按照与个人信息主体约定的用途使用个人信息,不得未经个人信息主体同意向第三方提供”。这意味着大数据征信机构向第三方提供信息,必须经信息主体的明确授权。目前很多互联网企业在隐私政策中规定,有权将用户信息同其他遵守同等隐私政策的平台进行交换和合作,用户容易忽略此类信息。

2.保障个人信息主体免费获得信用报告

大数据征信采集的信息是海量、多维的,网络社交平台或电商平台可能会在用户不知情的情况下采集和使用用户数据,或提供给第三方征信机构。而根据《条例》,个人信息主体有权每年2次免费获取本人的信用报告。作为大数据的所有者,消费者有权知道自己哪些信息被采用和使用,也有权对错误和遗漏的信息提起异议。例如,有些数据还可能仅仅是与用户相关的手机、电脑IP地址、用户ID,如果都归于客户本人可能不准确;还有,用户不小心点击了艾滋病药物的链接,可能会被“科学”地归类定义类如艾滋病患者或家属等,从而在求职和购买保险申请时被拒绝。

3.报送个人不良信息应通知信息主体

《条例》第十五条规定,信息提供者向征信机构提供个人不良信息,应当事先告知信息主体。目前,许多电商平台或者社交平台利用产生的信息、合作伙伴(如租房、婚恋网站等)的信息、政府公开的信息以及互联网抓取的信息,对信息主体的信用状况进行评估。而按照《条例》的上述规定,信息提供者(如电商平台或其合作伙伴)在向征信机构报送客户的不良信息时,应当事先告知信息主体,

国际金融 2015-9

INTERNATIONAL FINANCE 64

INTERNATIONAL FINANCE 65

避免信息错误对信息主体产生不利的影响,或督促信息主体尽快履约。

(三)评分模型的有效性

传统信用评分模型如FICO已经过几十年的发展,其有效性已经得到充分的检验;而大数据征信才刚刚兴起,模型的预测能力尚待考证。如在线获取的信息是否完整,社交数据与个人信用的相关程度,对网上不够活跃的客户是否会产生歧视等等。

1.大数据是否准确

大数据给信用评估带来了巨量的信息,但是巨量的信息中也有废料,涉及的地域和领域越多,产生的废料可能也就越多。根据2014年3月美国国家消费者法律中心(NCLC)对4家大数据征信公司的调查报告《大数据,个人信用评分的大失望》的统计,大数据征信公司的信息错误率高于50%,有“垃圾进,垃圾出”之嫌。

2.社交数据能否评估个人信用

用社交数据进行信用评价,一直备受争议。社交数据是否能够预测人的长期信用行为?如果可以的话,哪些社交媒体数据会跟个人的还款行为存在强相关性。目前,美国的三大征信巨头均未使用社交数据,而芝麻信用等国内的8家个人征信机构的信用评分则均包括社交数据,不过所占比例较低(5%以下)。此外,社交数据更容易被操纵。与实际还款记录不同,一个人的社交数据可以被人为操控,因而很多人为了获得良好的信用评价,可能会操控

自己的社交数据。如“芝麻分”面世后,就有人在

网上曝光刷分攻略。

3.算法模型的有效性

互联网上的数据大多是杂乱无章的,甚至残缺的,难以利用这些数据对信用进行可靠的预判。这

就需要用先进的算法来挖掘数据。美国大数据金融

公司ZestFinance的核心竞争力就在于其强大的数据

挖掘能力和模型开发能力。目前其已开发了14个

信用评估模型,并将信用评估模型细化为八大类,

适应于不同的信用风险评估。在我国,大数据征信

才刚刚起步,所推出的算法模型是否有效,尚需要

时间和相关数据来检验。

(四)征信机构的独立性

大数据征信机构多由互联网企业发起。这些互

联网企业沉淀了大量的用户数据,从事征信业务具

有先天的优势,但也带来一个问题。他们既生产数据,又评估数据,还使用数据。相当于既当裁判员

又当运动员,不符合“独立第三方”的资质,会影

响征信产品的公正性和独立性。以芝麻信用为例,

芝麻分可用在租车、旅游、办签证等场景,而其数

据主要源自阿里系,这就意味着个人为了提高芝麻分,必须在阿里生态圈里做更多事,比如寻找更多

芝麻分高的人并成为好友,使用支付宝缴纳水电煤

气费,在天猫、淘宝、聚划算购物消费,购买阿里

系的理财产品等。而央行的征信系统则是完全独立

2015-9 国际金融

于信贷交易双方的第三方,具有中央银行的公信力,而且不以盈利为目的。

五、推动大数据征信健康发展的政策建议

(一)完善法律法规,确保个人的信息安全

一是在立法层面,制定《个人信息保护法》,界定个人信息的范畴,明确“消费记录、网络痕迹”等互联网上产生信息的所有权,并确保用户对互联网个人信息的知情权和控制权,防止信息泄密或者损害个人隐私。二是根据《征信业管理条例》和《征信机构管理办法》,制定大数据征信的监管细则,明确大数据征信的信息采集范围、使用范围和信息披露要求。在数据采集方面,要求征信数据的收集必须是充分、相关和适量的,并且与数据收集、处理目的密切相关,不得收集和处理与目的不相关的信息,避免信息的过度采集;在数据使用方面,列举信用报告的合法用途,如申请贷款、商业保险,雇佣提拔,合法的商业交易申请,政府部门颁发执照,享受社会福利等;在信息披露义务方面,大数据征信机构应保证数据处理程序的透明度,披露业务流程和信用评估模型,为信息主体查看本人被采集的信息提供便利等,切实保护信息主体的合法权益。

(二)适应征信新常态,加强对大数据征信的监管

人民银行杨子强行长助理在2014年征信系统建设座谈会上指出,征信监管要适应征信业发展步入的新常态:互联网、大数据技术正引领征信领域变革,征信市场竞争互补的发展格局逐步形成,数据应用实践对权益保护提出了更高的要求。据此,应根据大数据征信的新特征和新模式,探索大数据征信的监管举措:一是机构监管与行为监管相结合。对于掌握大数据的企业,不仅监管征信业务和征信主体,还监管其数据使用的行为,重点监督信息采集范围、业务流程、评价方法等。二是分类监管与动态监管相结合。针对不同类型和业务规模的征信机构,实施市场准入、非现场监管、现场检查相互依存的监管流程;同时对以大数据、云计算为特点的大数据征信业务,实行动态监管,建立事前、事中、事后全面监督体系。

(三)加强信息披露,保障信息主体的合法权益

加强大数据征信的信息披露,是保障信息主体的知情权与异议权的重要手段。美国联邦贸易委员会曾呼吁,应赋予消费者对自身数据更多的知情权和控制权,切实保护消费者权益。大数据征信机构应对客户进行充分的信息披露,及时向消费者披露采集的个人信息,解释算法模型的运作,以及数据的分析和预测;以易懂的语言,事先告知客户数据如何采集和使用,以及数据采集使用的目的;告知第三方查询和使用数据必须事先获得用户许可,用户有权禁止自己的数据被交换分享或者被纳入任何大数据集。美国最大的数据服务商安客诚(Axicom)2013年9月推出了面向消费者的网站(Aboutthedata. com),支持通过认证的消费者在线查看本人被收集的信息(不包含加工处理后的衍生数据)并可在线更正。

(四)强化数据质量,提高评估模型的有效性

由于大数据的维度广,数据错误和数据丢失等现象会更加突出,这就需要通过数据清洗和交叉验证等技术,识别用户身份,寻找丢失的数据,解决互联网上获取的线上信息不完整的问题,确保数据的真实性、完整性和有效性。同时,应不断完善和更新信用评估模型,挖掘海量数据与信用风险的相关性,通过客户属性、交易记录、评价信息以及商品信息,合理预测用户的违约率和逾期率,提高评估模型的准确性和有效性。最后,扩大评估模型的适用范围,避免对网上不够活跃用户信用评价不公平的问题。

(责任编辑:李亚芬)

国际金融 2015-9

INTERNATIONAL FINANCE 66

相关主题
文本预览
相关文档 最新文档