经产观察
IT资讯
IT产业动态
业界
网站运营
站长资讯
互联网
国际互联网新闻
国内互联网新闻
通信行业
通信设备
通信运营商
消费电子
数码
家电
国内互联网新闻

互联网大数据发展下的信用体系建设现状(另附线性回归模型建模方法

作者:habao 来源: 日期:2018-2-24 3:42:27 人气:

  ,央行印发《关于做好个人征信业务准备工作的通知》,要求芝麻信用管理有限公司、腾讯征信有限公司、拉卡拉信用管理有限公司等8家机构做好个人征信业务的准备工作。

  2017年4月21日,央行征信局局长万存知在个人信息与征信管理国际研讨会上透露,:综合判断,8家进行个人征信开业准备的机构目前没有一家合格,在达不到监管标准情况下不能把牌照发出去。

  对于这8家机构存在的问题,每一家机构都想追求依托互联网形成自己业务的闭环,但每一家信息覆盖范围都有限,信息不广、不全面,导致产品有效性不足,不利于信息共享。

  2017年12月4日讯,中国互联网金融协会第一届常务理事会2017年第四次会议,审议并通过了协会参与发起设立个人征信机构(简称“信联”)的事项。“信联”由互金协会与8家个人征信业务机构共同发起成立。“信联”将纳入央行征信中心未能覆盖到的个人客户金融信用数据,构建一个国家级的基础数据库,实现行业的信息共享,以有效降低风险成本。

  FICO评分系统采集客户的人口统计学信息、历史贷款还款信息、历史金融交易信息、人民银行征信信息等解释变量。违约率即为被解释变量。通过逻辑回归模型计算客户的还款能力,预测客户在未来一段时间的违约概率。经由违约率对应的信用分数,最终输出最终分数并确定不同自变量对违约率的影响程度。

  银之杰、创恒鼎盛、清控三联、新奥资本分别持有华道征信40%、30%、15%、15%的股权。控股集团持有清控三联100%的股权;

  隶属于中国诚信信用管理集团(该集团成立于1992年,前身是经中国人民银行总行批准设立的中国诚信证券评估有限公司)

  董事长是盛希泰,全国青联常委并金融界别秘书长,中央青联副。曾任华泰联合证券有限责任公司董事长;

  是中国最早成立的商业征信机构之一,其最早建设的“深圳市个人信用征信系统”从2002年8月开始运行,目前所能提供的个人和企业征信服务已经覆盖全国;

  数据收集:假设收集10万条数据,每个数据包括5*10(5个大类,每类10个指标)个属性(样本空间即属性空间为50),标记信息为:要预测的变量。(违约率,还款能力)

  机器建模学习过程:将数据随机抽取分成训练集及测试集,其中用以学习模型的训练集占85%(8万5000条),用于验证模型的占15%(1万5000条)。

  逻辑回归建模:采用逻辑回归进行建模,采用 BIC 的方法选择模型,通过模型得到每个变量对是否违约的影响系数。同时归纳出违约用户及非违约用户的特征。

  得出信用分:通过线性变换可以将预测概率 P 为 350 至 900 的用户得分 Q,Q=X+Y×P。输入一个新用户的50个数据指标,从而得出对应的预测概率P,从而得出信用分Q

  不断训练及优化模型:用户不断的更新新的数据指标,每个指标下不断积累新的数据量,同时不断的新的用户进来。通过新的数据训练优化逻辑回归模型。

  

推荐文章