买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于随机森林的灵活就业人员公积金缴存方式推荐方法_刘娟;陈雪;宋阳;杨世利;宋鹏_202210989879.1 

申请/专利权人:刘娟;陈雪;宋阳;杨世利;宋鹏

申请日:2022-08-18

公开(公告)日:2022-11-04

公开(公告)号:CN115292604A

主分类号:G06F16/9535

分类号:G06F16/9535;G06Q40/08;G06K9/62;G06N5/00

优先权:

专利状态码:在审-实质审查的生效

法律状态:2022.11.22#实质审查的生效;2022.11.04#公开

摘要:本发明涉及一种基于随机森林的灵活就业人员公积金缴存方式推荐方法,包括如下步骤:选用历史公开数据集,选取灵活就业人员信息user和公积金缴存方式信息payment;定义初始信息矩阵Vu_p,对初始信息矩阵Vu_p中的数据使用合成少数类过采样技术smote,解决Vu_p中存在的数据不平衡现象,得到最终训练集Vtrain;在训练集Vtrain上使用随机森林模型RF训练,得到预训练好的灵活就业人员公积金缴存方式预测模型Mp。本发明方法可以有针对性的快速有效的为灵活就业人员推荐公积金的缴存方式。

主权项:1.一种基于随机森林的灵活就业人员公积金缴存方式推荐方法,其特征在于:包括如下步骤:S100:选用历史公开数据集,数据集包括灵活就业人员信息user和公积金缴存方式信息payment;user包括自变量特征,payment包括因变量特征;S200:采用随机森林模型作为预测模型Mp并进行模型参数初始化,对预测模型Mp进行训练,具体步骤如下:S300:对公开数据集中所有数据进行数据平衡性处理得到数据集Vtrain;S310:从数据集Vtrain中进行T次随机采样,得到T个采样集,选择第t个采样集Dt中的一部分数据作为训练集Dt_train,另一部分作为验证集Dt_valid,其中t∈1,...,T;S320:从Dt_train中随机选择I个自变量特征组成特征集C,特征集C中的第j个特征包括s个子特征,其中,每个子特征对应一种缴存方式ym,j=1,2,…,J,J表示C中特征的数量;S321:利用熵值公式计算C的总熵,具体计算表达式如下: 其中,|Ci|表示Dt_train上第i种缴存方式的特征总数,其中,m表示第i种缴存方式的数量;S322:计算C中第j个特征的条件熵HDt-trainj,具体计算表达式如下: 其中,n代表特征Cj中包含的特征值的总数,k=1,...,n,|Dt_traintj|代表Cj中包含的缴存人总数,|Dt_traintjk|代表Cj中值等于k时的缴存人总数,HDt_traintjk是代入熵值公式中计算出的Cj中值等于k时的熵值;S330:利用总熵和条件熵计算第j个特征的信息增益Gj,具体表达式如下:Gj=HDt_train-HDt_trainj;3S340:j遍历所有取值,计算出C中J个特征的信息增益,然后将求得的所有信息增益降序排列,选择信息增益最大值对应的特征作为根节点;将增益最大值对应的特征所包含的p个子特征作为所述该根节点的p个分支节点;将增益最大值对应的特征中的每个子特征所对应的缴存方式作为对应分支节点下的叶节点;S400:由根节点、分支节点和叶节点构成采样集Dt的决策树Mt,将验证集Dt_valid中的所有数据作为决策树Mt的输入;S410:计算Mt的原始精度Precision_old,表达式如下: 其中,TP表示针对根节点的真实值与预测值都为真,FP表示针对根节点的真实值为假且预测值为真;S420:令q=1;S430:计算第q个分支节点的精度Precision_new,具体表达式如下: 其中,TP′表示第q个分支节点的真实值与预测值都为真,FP′表示第q个分支节点的真实值为假且预测值为真;S440:当Precision_old≤Precision_new时,删除第q个分支节点,令q=q+1并返回S420;否则得到训练好的决策树Mt′,并执行下一步;S500:遍历所有的T个采样集,得到T个Mt′组成训练好的预测模型Mp;S600:选取待预测灵活就业人员信息t_user,利用python将t_user进行格式转换,得到适用于Mp输入的数据格式,所述适用于Mp输入的数据格式为信息矩阵Vu_t=[x1...xt];S700:将信息矩阵Vu_t输入训练好的预测模型Mp中,得到T个预测缴存方式,将T个预测缴存方式中出现次数最多的缴存方式作为对该待预测灵活就业人员的公积金缴存方式推荐结果。

全文数据:

权利要求:

百度查询: 刘娟;陈雪;宋阳;杨世利;宋鹏 基于随机森林的灵活就业人员公积金缴存方式推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。