苟志龙:新时代背景下机器学习技术对传统风控的变革

来源:网络整理    作者:JSI    人气:    发布时间:2019-05-08    

  和讯网消息 5月8日,由中国民生银行(600016)研究院主办的“金融科技助力实体经济高质量新发展青年论坛”在北京召开,和讯网对论坛进行全程图文报道。中国民生银行信息科技部苟志龙发表“新时代背景机器学习技术传统风控变革”的主题发言。

  以下为嘉宾发言全文:

  今天跟大家分享的主题是《新时代背景机器学习技术对于传统风控变革》。今天的发言分为四个部分:第一新时代背景下银行业的金融困局,数据驱动助力银行业变革;第二全球个人信贷风控技术发展历程;第三是今天的核心环节,我会跟大家分享民生银行利用机器学习技术在量化风控领域的实践,我们取得的成果;第四快速的总结一下量化风控的新技术实现的意义与价值。

  第一数据驱动助力银行业变革

  大家都知道,新时代背景下信贷银行业的金融困局还是很明显的,利差空间收窄,互联网金融介入导致泛间业竞争加剧,我们内生的增长模式随着时间的变化,旧有的增长模式可能已经难以维系了。我观察了一下,今天9位发言人当中,至少有3位都在谈论大数据、人工智能,其实大数据背后蕴含的是信息,这位先生有一句非常有名的话叫做“信息是用来降低不确定的东西”,银行的核心竞争力在于降低风险,风险需要从信息中去解读,我们通过技术,通过数据+算法来降低不确定性,不确定性降低之后,我们开展业务就不像现在这么难了。

  下面谈一谈数据、算法,数据是很根基的东西,我们都在谈大数据,刚才很多专家都在谈千人千面,大数据画像,人工智能,其实离开数据可能那些都做不了了。我们现在在谈数据,数据背后本身是由信息在做支撑,数据仅仅是信息的载体。数据蕴含的信息里面我们经过技术的挖掘,通过算法,通过机器学习和人工智能,能够挖掘出很多跟我们目标业务场景相关的一些知识,这些知识能够解决很多问题,这实际上就是数据驱动业务内在的机理,也是数据驱动能够产生作用的根本原理。

  第二个人信贷风控技术发展史

  数据驱动是基于技术去驱动经营的全新理念,为我们银行业改变增长方式提高了可能性。零售业务里面,如果我们用数据驱动来解决或者改善我们的零售资产管理,降低贷款损失,增加盈利,可能我们的经营困局会在某种程度上得到环节。数据驱动很重要,但是我们需要用数据和算法来产生知识,指导我们开展业务。

  简单总结一下个人信贷风控技术的发展历程,大体有四个阶段。大家知道,任何技术的产生都是时代的宠儿,一个技术的产生是为了解决那个时代我们在风控领域里可能的一些痛点和问题。这些技术带有非常深的时代烙印,同时也必不可少的会带有时代的局限性,所以我们看到风控技术随着时间的推移快速的更迭。这四个风控技术我重点会聚焦到第三和第四,看一下统计学习和机器学习,相信大家并不陌生。统计学习是上世纪80年代在全球推广的用于支持银行业个人贷款授信业务的量化工具。机器学习也由来已久,七八十年代就产生了,但是直到2000年之后才逐渐的被应用到银行的数据驱动领域里面来。打个比方,简单区别一下统计学习和机器学习,统计学习其实是把一个问题投射到一个比较低维的空间里面,是一种线性思维,是一种对应分析,它所构建的模型简单稳定,但是缺点也很明显,性能提升的空间非常大。机器学习可以理解为是一种高维空间思考问题的方法,把一个业务问题可以投生到千万维的空间当中进行深刻的分析,数据所携带的信息经过算法的分析之后,可以生成帮助我们识别申请借款人风险的知识,有了这些知识之后,就可以用来指导贷前的准入、贷后的风控。

  民生银行从2014年由风险部门、业务部门、科技部门在一起,把机器学习技术应用于我行的量化风控领域。经过这几年在多个项目里面的落地实践,我们沉淀了很多技术。这里有我们最推崇的自定义的机器学习技术,还有精确的模型训练轨迹技术,还有行业去燥技术,包括可以符合尽管的黑盒模型解析技术,借助这些技术,我们的模型性能可以远远超越上世纪那套解决方案的水平,从实际使用效果来看也非常好。

  第三机器学习技术在量化风控领域的案例

  我们看一下民生银行做了哪些事情,效果如何。今天重点跟大家分享两个案例,一个是用于贷前的,一个是用于贷后的。贷前的案例需要解决我们下沉客群风险普遍偏高,数据少的情况下怎么做好贷前的准入工作。贷后风险预警的项目来自于民生银行的零售资产管理优化项目,这是这个项目的核心组成部分。这一系列模型要解决的问题是,针对我们零售贷后风险管理过往历史中经常出现的建设手段滞后、风险管理被动的问题,会出具一整套的解决方案。

  我们首先看看贷前的方案,当客户进门的时候我们是否可以精准的识别他的风险。这个方案区别于其他方案的原因在于,我们采用了高阶段学习、半监督学习的技术,做了非常严格的机器推断。我们之前做计量模型,如果不做推断的话,就好似你见到这个人有风险,见到跟他类似的人你能识别,但是如果差别比较大的时候识别不了。推断技术是可以通过合理的采样,通过民生银行的样本,知道在这个样本之外更广域领域借款人的风险情况,最后这个模型的效果非常好。我们拿它和民生银行现在在线服役的A卡做了比对,这里重点关注KS值,代表模型的风险区分度。一般来说,这个值越高越好。我们的模型相比于传统的模型有了17点的提升,它带来的利益非常直观,能够提高贷款通过率9%,这意味着我们的贷款规模可以在风险不增加的前提下提升9%以上。在增加通过率的同时,可以减少高风险贷款的产生,这个降幅我们经过了精确的测算,能够降低20%左右。这意味着20%的贷款损失,变相创利了20%。

  接下来是我们贷后预警系列模型的方案,这个方案是要解决民生银行针对零售贷款全品种在贷后全生命周期里怎么做好及时风险预警以及早发现、早处置,总体看来效果不错。通过全品种,下个月短期、中期、长期多个风险探头,我们可以缓解催收压力,提升催收效率,跟踪资产质量。

  这里比对了两个时代技术的差别,我们基于民生银行经历了三四年发掘出了对于识别贷后风险的核心变量,数据源、信息源完全相同,两代技术产生的性能差异是20%以上。最终我们得到了一个结论,新时代新技术确实是有红利的,我们应该好好把握。当模型形成之后,我们会根据这个风险评分分成5类模型,西安城市交通学院,从A到E,A代表风险最低,E代表风险最高。有了风险分类之后可以做什么?就可以做精细化的管理,我们对于每一类贷款在每个场景下做了一些差异化的管理。最终的效果是我们压降了成本,提高了业务的收益。

  这是最后的效果展示,这是在分行试点了三个月的最终效果。可以看出来,全系列的模型,不管是应用于压降临时的预期还是主动压降风险,催款律师函,实际上对于贷后的零售资产质量都是有明确的提升。

  第四量化风控的新技术实现的意义和价值

  今天这里特别想跟大家分享的是,人类社会最近几百年其实发生了翻天覆地的变化。我们从教科书了解到前两次工业革命对于人类社会的深刻变革,在座的绝大部分人也亲历了互联网以及移动互联网技术对于我们生活方方面面的影响。如今我们正在经历新一次的技术革命,我衷心的祝愿中国银行业可以在这次基础革命的东风里扬帆远航,再创辉煌,谢谢!

(责任编辑:王刚 HF004)

打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

责任编辑:JSI