买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于商业汇票信息的企业融资意愿度分析方法及模型_深度(山东)数字科技集团有限公司_202311642535.4 

申请/专利权人:深度(山东)数字科技集团有限公司

申请日:2023-12-04

公开(公告)日:2024-04-05

公开(公告)号:CN117829977A

主分类号:G06Q40/03

分类号:G06Q40/03;G06Q40/06;G06Q30/0601;G06F18/214;G06F18/2415

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.23#实质审查的生效;2024.04.05#公开

摘要:本发明涉及信息管理技术领域,尤其涉及一种基于商业汇票信息的企业融资意愿度分析方法及模型。本发明提供的基于商业汇票信息的企业融资意愿度分析方法,能够合理确定各特征指标对企业融资意愿度分析的有效程度、各特征指标之间的相关性及对模型计算的贡献率,科学地筛选降低指标维度、提高后续逐步回归效率,快速精准预测客户的贷款意愿。本发明提供的基于商业汇票信息的企业融资意愿度模型,能够实时计算出供应链上关联企业的意愿分,促进金融机构开展精准营销,缩短营销路径,降低营销成本,提高营销转化率。通过监控意愿分的变化,及时掌握产业客群融资、经营周期并快速锁定客户,作为基于供应链关系的普惠金融业务客户企业群体批量获客。

主权项:1.一种基于商业汇票信息的企业融资意愿度分析方法及模型,包括:S1指标离散化处理,针对是否有借款意愿的二分类问题,对特征指标采用概率论卡方检验进行分析,表示两个类型是独立的,表示两个类型是相关的; ;其中,表示第i行、j列观测类型计数,表示第i行、j列期望类型计数,拒绝阈,有个自由度;S2建模之前数据预处理,通过前置筛选降低指标维度,提高后续逐步回归效率;S2.1筛选变量X分布的连续性,证据权重WOE是衡量X对Y二类结果分离程度的统计量,WOE越高分离程度越高,基于卡方检验对X离散化后的结果统计每个离散区间值,选取分布呈单调性或者正反U型分布的解释变量;其中TPR表示混淆矩阵中真正类率,FPR表示假正类率; ;S2.2筛选变量X的信息价值,IV是X变量的信息价值,IV越高解释变量X的整体解释能力就越强,相比较WOE指标IV考虑了整体的信息量,选取IV大于的解释变量X,所述取值范围0.03~0.1; ;通过计算IV,筛选出符合WOE单调性分布并且满足IV最低信息价值要求的指标;S2.3筛选变量X之间的相关性,r为变量间相关系数,如果两个变量之间相关系数超过,则认为是重复指标,所述的取值范围0.7~0.9; ;通过特征指标的WOE、IV值、两个变量之间的相关系数r,对相关性比较高的特征指标取信息价值IV最大的,降低入模变量多重共线性程度;当两个解释变量与之间的相关系数绝对值大于时,则选取其中IV最高的一个变量,从而一定程度模型训练前降低入模变量的多重共线性;S3应用模型训练算法,将二分类问题转化为概率问题,通过对解释变量X的代数转换从而估计样本归属类别的概率,训练出具有预测能力的模型;S3.1采用逻辑回归算法: ; ;合并上述两个公式可得: ;S3.2运用逐步回归方法进行模型迭代训练,剔除回归系数wald检验不显著或回归系数正负方向与业务期望相违背特征指标;将步骤S2中筛选出的指标作为特征指标池,每次往训练器加入1个变量,生成每个系数回归参数P值检验结果P-value;逐一剔除P-value值大于且最大对应的特征指标,其中,逐一剔除回归系数正负方向与业务期望相反方向特征指标;S3.3应用方差膨胀因子VIF对回归变量间相关性检验; ;其原理是把第i个解释变量作为响应变量,将其余变量作为解释变量,作线性回归计算模型得出判决统计量方差膨胀因子VIF;方差膨胀因子越大,说明越接近1,则第i个解释变量与其他解释变量之间共线程度越强;如果方差膨胀因子VIF大于,则认为该变更与剩余N-1个变量之间具备多重共线性,因而剔除该变量;所述的取值范围3~10;S4将逻辑回归训练结果的概率模型转化为评分形式,同时计算分数对应的借款意愿概率,概率是介于0~1之间的值而分数是介于0~900之间,分数更贴近业务场景的理解: ;设置p为整体训练样本中有借款意愿样本的概率时,的取值范围为1%~3%;S等于分,的取值范围500~700,设机会比率,每当odds翻倍时,S增加分,其中;pointdoubleodds简称pdo,pdo=;即当odds变成2倍时,对应评分所增加的分数,由此可以得,,获得分数与所对应的借款意愿概率刻度;S5通过评分模型评估预测概率效果,效果评估统计量包括混淆矩阵、KS、AUC;混淆矩阵: ;其中:预测有意愿并且真实有意愿,用TP表示;预测无意愿但真实有意愿,用FN表示;预测有意愿但真实无意愿,用FP表示;预测无意愿并且真实无意愿,用TN表示; ; ; ;其中,TPR表示真正类率,FPR便是假正类率,TPR与FPR之间最大差值称为KS指标,KS越大表示模型的效果越好; ; ;上述公式中,表示实际为正类样本的预测概率,表示实际为负类样本的预测概率,表示正类样本集和负类样本集1对1预测概率大小比较结果,AUC表示ROC曲线下的面积,AUC越大说明模型的解释能力越强,与KS有着相似的统计效果;从概率的角度来解释,AUC表示正类的样本与负类的样本两两比较概率大小的事件,其中正类的概率大于负类的概率的事件数量在总的事件中的占比。

全文数据:

权利要求:

百度查询: 深度(山东)数字科技集团有限公司 一种基于商业汇票信息的企业融资意愿度分析方法及模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。