北京宏图远见在此就以不良贷款预测分析和分支行业务健康度分析为例,简要阐述一下探索性数据分析的具体方法:
不良贷款预测分析
不良贷款率向来是银行的重要指标,如何降低不良贷款率,减少可能的贷款违约风险一直是银行管理层所关注的重点。通过有效的探索性数据挖掘,可以在对银行的历史违约贷款的数据特征进行归纳分析的基础上,得到有效的潜在违约贷款风险特征,从而对高违约风险贷款的发放采取更加严格的审批和复核。换言之,利用昨日的“失”,获取明天的“得”。具体的分析方式为:
1. 将历史违约贷款数据与正常贷款数据混合作为训练集,根据业务风险判断初步确定实还本息比率、贷款期限、贷款人信用评级、抵押物价值比率、担保方式等关键数据字段。
2. 选择合适的数学模型,比如C5.0决策树模型对训练集进行建模和规则归纳,根据信用审核职业判断以及模型置信度等指标,确定适合的数学模型和相应的特征阀值。
3. 使用模型对新增贷款项目进行验证,判别高违约风险贷款。
4. 最终形成树状判断结构,其中每一个节点都代表由于某个属性(例如贷款企业的资产回报率小于某个特定值)对该企业贷款违约可能性的影响和相应概率。
分支行业务健康度分析
对于规模庞大,分支行众多的商业银行来说,如何有效监控和管理各个分支行是总行和高级管理层所主要关注的重点。而通过数据分析中的聚类分析方法,就可以有效的对各个分支行进行较为全面的横向对比,从而了解各分支行的差异情况,并根据结果量身定制发展方针。聚类分析的具体步骤如下:
1. 通过数据汇总和运算,获取测试期间内各个支行相应的指标数据,包括:存贷比,贷款损失率,综合收益率,综合存贷利率差。
不良贷款预测分析
不良贷款率向来是银行的重要指标,如何降低不良贷款率,减少可能的贷款违约风险一直是银行管理层所关注的重点。通过有效的探索性数据挖掘,可以在对银行的历史违约贷款的数据特征进行归纳分析的基础上,得到有效的潜在违约贷款风险特征,从而对高违约风险贷款的发放采取更加严格的审批和复核。换言之,利用昨日的“失”,获取明天的“得”。具体的分析方式为:
1. 将历史违约贷款数据与正常贷款数据混合作为训练集,根据业务风险判断初步确定实还本息比率、贷款期限、贷款人信用评级、抵押物价值比率、担保方式等关键数据字段。
2. 选择合适的数学模型,比如C5.0决策树模型对训练集进行建模和规则归纳,根据信用审核职业判断以及模型置信度等指标,确定适合的数学模型和相应的特征阀值。
3. 使用模型对新增贷款项目进行验证,判别高违约风险贷款。
4. 最终形成树状判断结构,其中每一个节点都代表由于某个属性(例如贷款企业的资产回报率小于某个特定值)对该企业贷款违约可能性的影响和相应概率。
分支行业务健康度分析
对于规模庞大,分支行众多的商业银行来说,如何有效监控和管理各个分支行是总行和高级管理层所主要关注的重点。而通过数据分析中的聚类分析方法,就可以有效的对各个分支行进行较为全面的横向对比,从而了解各分支行的差异情况,并根据结果量身定制发展方针。聚类分析的具体步骤如下:
1. 通过数据汇总和运算,获取测试期间内各个支行相应的指标数据,包括:存贷比,贷款损失率,综合收益率,综合存贷利率差。
