风险定价模型：一把打开消费金融盈利模式的钥匙

查看原文

其他

风险定价模型：一把打开消费金融盈利模式的钥匙

原创 2017-06-09 清扬众安数盟

↑ 点击上方“众安数盟”关注我们

本文导航

共3100字

1、行业现状

2、风险定价基础篇

3、风险定价量化篇

4、风险定价模型篇

5、总结

行业现状

当申请信贷的人群过来申请贷款的时候，银行目前的做法是所有人都采用统一费率，一方面是受制于技术上的制约无法实现，另一方面是用户体验和风险评估没有深入到很细致的层面，才导致这个结果的发生。

风险定价，即对风险资产价格的评估，也就是互联网金融平台在运营过程中资本资产所带来的未来收益与风险的关系;通俗来讲，使质量好的客户能以较优惠的价格获得服务，质量差的客户需要以风险溢价作为补充。

互联网金融诞生之后，得益于技术的支撑和数据的打通，差异化的风险定价在实际线上实时放贷场景下，有了施展的空间和评估结果的手段。通过用户数据和交易数据可以搭建出核心的风险定价模型，这个模型可能涵盖了超成千上万个变量，通过机器学习等技术，应用到实际的风险定价当中。

那么在实际的应用场景中，对用户端和资产放贷端有什么好处呢？反复思考，我觉得有以下几个方面的考量优势

第一，对于信贷资信优质的客户可以降低费率，对于信贷资信差的客户，可以提高费率，做到资金有效分配，利于资源优化配置；

第二，针对于原先银行只做20%的用户，导致更多信贷资质一般的用户得不到现代金融服务，通过差异化定价的方式，可以让更多人得到金融服务，达到真正的普惠金融；

第三，通过借款表现数据反馈的形式，也可以更有利于贷款人约束规范自己的借款行为，珍惜自己的信贷表现，为产品降低更多的逆选择用户。

风险定价基础篇

风险定价的核心思路，主要有以下几点：

第一人群的划分，面对什么样的客群，客群的划分是否准确清晰，正所谓物以类聚，人以群分；

第二风险评估预测，这个客群的风险表现到底是怎样的，会产生多少的90+的坏账率；

第三成本分摊，将获客成本，资金成本，催收成本等涉及到信贷环节的支出分摊到每个客群上。

具体的常用定价方法有两种：基准利率定价法=基准利率 + 违约风险溢价 + 期限风险溢价；客户盈利分析法，从某一客户的身上获得的整体收益，是否能满足整体的利润要求，也就是根据成本和收益核算，对应的公式是：

贷款成本 = 资金成本 + 风险成本 + 运营成本 + 预期收益金额；

对于互联网消费金融来说，合适的定价方式是采用客户盈利分析法，

定价费率（预期利润） = 综合成本 + 风险溢价 + 预期收益

这就是最终的数学目标公式，非常简单。

风险定价量化篇

信用风险分为两部分，一部分为违约风险，另外一部分为价差风险。违约风险是指债务人不能或者不愿意及时归还利息及本金；信用价差风险是指债务人因为信用下降而导致能够还款的金额下降的风险。反过来理解，也就是一个是违约时间到达风险，另外一个就是违约大小，违约多少的风险。因此如果从上述观点思考的话，我们在考虑风险因素的时候，应该着重从以下几个点来思考产品因素的整体风险：

1.违约敞口，违约时候造成资损的随机变量，对于放贷金额的最大损失评估

2.转移概率，是指由于各种因素，例如工作变动，人生变故等等原因，借款人信用变化的概率，也称为信用转移，目前查看的视角有两种，一种是评级随着时间的变化而变化，例如上年评级在AAA，本年度下调到AA，在目前的现金贷产品中，此类方式更多的被实时申请技术取代，第二种是从产品风险的角度更多的是以贷款人在不同MOB的变化情况，来预估整体的转移概率表现

MOB	1	2	3	4	5	6	7
Aaa	0.0%	0.0%	0.0%	0.0%	0.1%	0.3%	0.5%
Aa	0.0%	0.0%	0.0%	0.1%	0.2%	0.3%	0.5%
A	0.0%	0.1%	0.2%	0.3%	0.5%	0.8%	1.3%
Baa	0.2%	0.5%	0.9%	1.4%	1.8%	2.3%	4.5%
Ba	1.1%	3.0%	5.3%	7.6%	9.8%	13.5%	18.4%
B	4.7%	10.2%	15.6%	20.3%	24.7%	32.5%	40.9%
Caa	17.7%	27.9%	36.1%	42.6%	47.8%	54.5%	64.9%

其中左边的纵坐标轴代表的是信用评价，包括了从Aaa到Caa，从上往下评价越来越低，横坐标代表的是随着贷款的时间期限，违约的概率图，根据自己产品人群的风险表现，可以定制属于产品本身的违约转移概率表。

3.违约概率，借款人不归还借款的概率，主要通过借款人贷前的数据表现来评估放贷之后的贷款违约表现情况

4.回收率，是指借款人发生违约后，仍然可以获得的资金所占比例,通常可以借鉴LOSSCAL的方式预测回收率模型，因为本身是动态的方法，因此需要建立多因子的模型，并具有统计学意义的显著性才能入选模型，一般的整体框架包含了以下的几个步骤：

a.转化：由于回收率分布是高度不对称的，峰度左偏，斜度右偏，可以用Beta分布函数来近似表示，重要确定中心和形状参数即可。不同类型的分级处理由不同的Beta分布来进行刻画，将Beta分布从Beta空间转化到正态空间变为对称的正态分布可以更加方便的处理，但是正态分布变量的概率和相应Beta空间的概率相同

b.建模，建模分为两步，即建立最小模型和真实模型，通过指标进行计算得到权重，确定合理权重，最小模型如下：

w = w0 + w1x1 + w2x2+...... + wkxk，其中x1是转化值，w是正态化的回收率

c.映射：由于w是正态空间，需要将Beta分布转换你应用与不同的分级处理，使用数学统计方法校验数据，验证模型有效性

d.将结果作为基准，与其他回收率模型进行比较，计算测算误差以及实际回收率的相关性

风险定价模型篇

依托于互联网金融的定价体系发展阶段大概经历了四个阶段，分别为如下展示：

1.一口价模式，简单粗暴，劣币驱逐良币，针对所有的用户群体都按照统一的费率标准进行展示

2.精算定价，解释方便，定价偏差大，以历史逾期率作为唯一的定价因子

3.数据定价，预测校准，解释性差，以30+的因子统计建模

4.大数据定价，难于解释，百万ID特征，实时的特征学习方法，具有实时审批，逾期率的实时预测，以及实时的差异化定价。

下面将以精算定价在实际场景中的应用方式来阐述如何将理论转化到具体的应用场景中,以及模型在提高风险的分割能力，提高定价的精度及准确性，确保策略的可调整性方面是怎么完成的。

a:一般模型的介入思维可以从改造现有，增加新进因子这两个方面来进行，优化现有定价因子，如果当前的定价因子并不是由多变量预测模型生成，或者当前的定价因子已经沿用多时，需要进行更新；添加复合层级定价因子，复合层级变量是由一组定价因子建立，并能形成对应的评分分组，好处：可以平滑因定价因子改变而造成的对整体费率的扰动，同时可以在增加新的定价因子时候，合理的处理可以进一步增加整体的费率区分度。

b:搭建的精算模型将引入广义线性模型，为什么选择这样的模型？这个模型有什么应用上的好处？广义线性模型（generalized linear model, GLM)是简单最小二乘回归（OLS)的扩展，在OLS的假设中，响应变量是连续数值数据且服从正态分布，而且响应变量期望值与预测变量之间的关系是线性关系。而广义线性模型则放宽其假设，首先响应变量可以是正整数或分类数据，其分布为某指数分布族。其次响应变量期望值的函数（连接函数）与预测变量之间的关系为线性关系。因此在进行GLM建模时，需要指定分布类型和连接函数。其中分布参数包括了binomaial（两项分布）、gaussian（正态分布）、gamma（伽马分布）、poisson(泊松分布)等。和lm函数类似，glm的建模结果可以通过下述的泛型函数进行二次处理，如summary()、coef()、confint()、residuals()、anova()、plot()、predict()

c.建模的整体步骤：

c.1.数据准备，确定数据结构，目标变量，选择建模的定价变量，风险暴露的调整，损失调整，生成交互变量，因为选择的是纯风险损失模型，因此目标变量的选取是预估即将发生的损失金额，纯风险损失=已发生损失/风险暴露

c.2.建模，广义线性模型结构和相应的模型设计，对模型输出的解释，模型调整

c.3.增添复合层级变量的主要步骤，复合层级变量的模型设计，选择复合层级因子变量（Tier Element)，生成复合层级分数并进行复合层级分组

c.4.建立模型，生成模型参数，选择逾期分布和连接函数，生成GLM赔付率模型

c.5.模型验证，不同定价区间的模型Lift提升度收益图

总结

金融领域从未来的发展方向来看，将会依托于大数据平台，将个人的互联网数据有效的整合到一起，形成一个风险管理风险控制体系，进而为风险进行更准确更公平的定价，这将会是最终真正的创新，而众安已经跑在了行业的前沿。

敬请期待：风险定价利器xgboost-机器学习定价实战篇

干货回顾

1、消金时代：谈谈数据与风控的那些事儿

2、众安反欺诈成长背后那份价值千万的经验（一）接口应用

3、众安反欺诈成长背后那份价值千万的经验（二）大数据反欺诈离线与在线

4、地址定位与风控的美丽邂逅（启蒙篇）

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言