买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种风控规则生成方法、系统及存储介质_厦门国际银行股份有限公司_202311157883.2 

申请/专利权人:厦门国际银行股份有限公司

申请日:2023-09-08

公开(公告)日:2024-03-19

公开(公告)号:CN117196823B

主分类号:G06Q40/03

分类号:G06Q40/03;G06Q10/0635;G06Q10/0639;G06F18/214;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2023.12.26#实质审查的生效;2023.12.08#公开

摘要:一种风控规则生成方法、系统及存储介质,方法包括:获取原始样本数据集;基于卡方分箱方式与客户标签,对自变量进行分箱,筛选出符合预设筛选条件的潜在规则变量;对原始样本数据集进行抽样,得到第一训练样本集与第二训练样本集;设置迭代训练停止目标值;根据潜在规则变量的数量选择对应的规则筛选方式,以生成规则集;根据预设规则筛选条件对规则集进行数据剔除与数据比对处理;基于新的样本数据集进行迭代训练,直至产品目标收敛至迭代训练停止目标值,并输出每次迭代训练生成的规则集。本发明根据潜在规则变量的数量选择对应的规则筛选方式,结合迭代训练停止目标值的设置,能够不断对规则进行优化,批量生成质量较高的风控规则。

主权项:1.一种风控规则生成方法,其特征在于,包括以下步骤:S100、获取原始样本数据集,原始样本集中包含客户标签及自变量;S200、基于卡方分箱方式与客户标签,对自变量进行分箱,筛选出符合预设筛选条件的潜在规则变量;对原始样本数据集进行抽样,得到第一训练样本集与第二训练样本集,第一训练样本集与第二训练样本集内至少包括客户标签与潜在规则变量,潜在规则变量为数值型变量;S300、基于第一训练样本集、第二训练样本集,以及潜在规则变量的对应阈值,设置迭代训练停止目标值;S310、判断第一训练样本集中每条潜在规则所包含的潜在规则变量的数量,并根据数量选择对应的规则筛选方式,以生成规则集;S320、根据预设规则筛选条件对规则集进行数据剔除与数据比对处理,得到新的样本数据集以及最优规则;S330、基于新的样本数据集进行迭代训练,直至产品目标收敛至迭代训练停止目标值,并输出每次迭代训练生成的最优规则所组成的规则集;步骤S310至少包括以下步骤:S311、判断第一训练样本集中每条潜在规则所包含的潜在规则变量的数量,若潜在规则变量的数量为一个,则执行步骤S311a,若潜在规则变量的数量为两个,则执行步骤S311b;S311a、获取第一训练样本集中的所有潜在规则变量的对应阈值,选取潜在规则变量的对应阈值的最大值,并基于最大值选取第一训练样本集中预设比例的第一客群,或者,选取潜在规则变量的对应阈值的最小值,并基于最小值选取第一训练样本集中预设比例的第一客群;计算第一客群的逾期率与收益率;根据逾期率与收益率的计算结果,筛选出第一规则集;S311b、获取第一训练样本集中的潜在规则自变量,通过排列组合的方式在所有潜在规则变量中随机筛选出两个潜在规则变量的组合;通过等频分箱方法形成行数为N、列数为M的交叉表,交叉表中的每个网格表示同时满足两个潜在规则变量的组合分箱阈值的样本集合;获取交叉表中预设位置网格所对应的规则并进行保存,得到第二规则集以及根据其中每条规则筛选得到的第二客群;执行步骤S312;S312、重新设置步骤S311b中交叉表的行数与列数,并基于新的行数与列数,重复步骤S311b,直至得到所有潜在规则变量的组合对应的多种交叉表下的第二规则集合以及第二客群;步骤S320至少包括以下步骤:S321、根据预设规则筛选的样本量条件,对步骤S311a与S312得到的第一规则集与第二规则集进行第一剔除处理;S322、根据预设规则筛选逻辑,对第一剔除处理后得到的剩余规则进行筛选,得到第三规则集;S323、对于第三规则集中的每条规则,筛选出第二训练样本集中与其对应的第三客群,并分别与步骤S311a中的第一客群、步骤S312中的第二客群进行数据比对,以得到符合预设条件的最优规则;S324、根据步骤S323筛选后得到的最优规则,对第一、第二训练样本集进行第二剔除处理,剔除命中最优规则的样本数据,得到新的样本数据集;步骤S321中,预设规则筛选的样本量条件具体包括预设规则筛选得到样本量对应的第一上限值与第一下限值;第一剔除处理具体为:剔除第一规则集与第二规则集中规则筛选得到的样本量大于第一上限值的规则,以及剔除第一规则集与第二规则集中规则筛选得到的样本量小于第一下限值的规则;步骤S322中,预设规则筛选逻辑具体为:通过筛选得到逾期率高于预设逾期率阈值,或者收益率低于预设收益率阈值的规则;步骤S323中数据比对具体为:将第三客群的逾期率与第一客群的逾期率进行数据比对;若第三客群的逾期率下降幅度大于预设下降比例,则从第三规则集中剔除该规则,并在剩余规则中选取对应的第一客群中逾期率最高的规则作为最优规则;或者,将第三客群的收益率与第一客群的收益率进行数据比对,若第三客群的收益率上升幅度大于预设上升比例,则从第三规则集中剔除该规则,并在剩余规则中选取对应的第一客群中收益率最低的规则作为最优规则。

全文数据:

权利要求:

百度查询: 厦门国际银行股份有限公司 一种风控规则生成方法、系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。