首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于决策树模型的二代征信特征衍生系统及装置_国槐(上海)信息科技有限公司_202410279707.4 

申请/专利权人:国槐(上海)信息科技有限公司

申请日:2024-03-12

公开(公告)日:2024-05-17

公开(公告)号:CN118052636A

主分类号:G06Q40/03

分类号:G06Q40/03;G06N5/01;G06F18/27

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.04#实质审查的生效;2024.05.17#公开

摘要:本发明涉及征信处理技术领域,具体涉及一种基于决策树模型的二代征信特征衍生系统及装置,为解决现有手动特征工程繁琐耗时,过于依赖人的经验和判断的问题。所述特征衍生系统完成评分并将评分结果发布到现有技术的决策引擎中使用。所述特征衍生系统通过XGB模型和逻辑回归模型完成分值转换,获得每个样本的违约概率,通过分数转换逻辑转换为评分,进而获得评分结果将所述评分结果导出为PMML格式,发布到现有技术的决策引擎中使用,特征衍生系统完成评分流程。解放了人力,有效解决了现有手动特征工程繁琐耗时,过于依赖人的经验和判断的问题。

主权项:1.一种基于决策树模型的二代征信特征衍生系统,其特征在于,所述特征衍生系统完成评分并将评分结果发布到现有技术的决策引擎中使用,所述评分流程包括S1:获取原始征信报文,得到原始指标;S2:将原始指标转换为标准化格式的中间数据;S3:将中间数据输入专家特征衍生系统中进行一次人工衍生处理,得到专家衍生指标,将专家衍生指标和原始指标合并保存为离线样本数据,定义为Fx特征样本;S4:对Fx特征样本进行清洗预处理操作,获得洁净Fx特征样本;S5:将洁净Fx特征样本拆分为训练集X_train和测试集X_test;训练集X_train分拆为用来训练XGB模型的X_train_xgb部分和用来训练逻辑回归模型的X_train_lr部分;S6:通过X_train_xgb部分训练和测试集X_test测试获取目标XGB模型;S7:获取训练集所有目标XGB模型的树的叶子节点索引,得到索引列;将索引列tree_1、tree_2...tree_n合并原始特征形成新的特征集Xlr=[X_train_xgb,X_leaf],n为树的数量,索引列合并原始特征形成新的特征集Xlr=[X_train_xgb,X_leaf];S8:根据特征集Xlr判定原始样本是高风险样本还是低风险样本,并且依据X_train_lr部分构造新的逻辑回归模型;S9:将所述测试集X_test导入所述目标XGB模型,获取测试集叶子节点索引;将测试集叶子节点索引作为新的特征合并到测试集X_test,形成新的扩展测试集:X_lr_test=[X_test,Xleaf_test]用新的扩展测试集验证新的逻辑回归模型的有效性:X_lr.scoreX_lr_test,y_test多次循环S5到S9,并记录分数,将分数最高的新的逻辑回归模型确认为目标逻辑回归模型,使用目标逻辑回归模型完成后续的分值转换;S10:目标XGB模型输出的叶子节点索引特征进行WOE转码,转码后特征为Xwoe;S11:Xwoe特征输入到目标逻辑回归模型进行训练,获得每个样本的违约概率,好样本概率为1-p,违约概率与正常样本的比值为Odds,通过分数转换逻辑转换为评分:Score=BASE-B*LNOdds;进而获得评分结果;其中,BASE是固定值,B是个系数,LN为取自然对数;BASE和B都是设定值;S12:将所述评分结果导出为PMML格式,发布到现有技术的决策引擎中使用,特征衍生系统完成评分流程。

全文数据:

权利要求:

百度查询: 国槐(上海)信息科技有限公司 一种基于决策树模型的二代征信特征衍生系统及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术