买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于lasso回归预测治疗费用的方法_辽宁省肿瘤医院_202011044746.4 

申请/专利权人:辽宁省肿瘤医院

申请日:2020-09-28

公开(公告)日:2024-01-26

公开(公告)号:CN112183861B

主分类号:G06Q30/0283

分类号:G06Q30/0283;G16H10/60;G16H50/70;G06F16/35

优先权:

专利状态码:有效-授权

法律状态:2024.01.26#授权;2021.01.22#实质审查的生效;2021.01.05#公开

摘要:本发明公开了一种基于lasso回归预测治疗费用的方法,所述方法中,获取电子病历样本,基于样本的变量的离散、线性分布将样本数据转换成数值数据以生成电子病历的数值特征;比较变量的缺失程度,将缺失程度较高的变量删除,然后对缺失程度较低的变量采用聚类方法估算插值,选取k个距离当前变量最近的变量,将距离值设置为权重值,通过加权插值估算缺失值,得到病历数据集;根据数据的正态分布对模型权重进行自适应调整,通过在迭代过程中根据变量分布位置分配正态函数的权重形成模型;数据输入模型进行训练得到预测结果。

主权项:1.一种基于lasso回归预测治疗费用的方法,其特征在于,所述方法包括以下步骤:第一步骤中,获取电子病历样本,基于样本的变量的离散、线性分布将样本数据转换成数值数据生成电子病历的数值特征,作为费用预测的数据集;第二步骤中,比较变量的缺失程度,将缺失程度较高的变量删除,然后对缺失程度较低的变量采用聚类方法估算插值,选取距离缺失值最近的k个变量,将k个距离值设置为权重值,通过加权插值方法估算缺失的变量值,得到病历数据集,每一条病历样本设置成数组Xi=[Xi1,Xi2,···,Xi(n+1)],其中包含了n个特征变量和一个目标变量,每一数组中,比较变量的缺失程度,将缺失值超过20%的变量删除,然后对缺失值低于20%的数据采用聚类方法估算插值,,其中,为测试点到聚类中心距离,代表权重,代表近邻点i与测试点距离;第三步骤中,基于1范数与2范数的变量筛选公式为,其中,为模型权重参数,为回归模型中1范数权重,为正则化系数,根据数据的正态分布对模型权重进行自适应调整,调整,其中,为变量值,为模型参数,为数据集分布的对称轴,在迭代过程中根据变量分布位置分配正态函数的权重;第四步骤中,数据输入模型进行训练,之后通过测试集对模型预测精度进行验证。

全文数据:

权利要求:

百度查询: 辽宁省肿瘤医院 基于lasso回归预测治疗费用的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。