买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于bagging算法的乳腺癌预测方法_山东大学_202110203468.0 

申请/专利权人:山东大学

申请日:2021-02-23

公开(公告)日:2021-06-08

公开(公告)号:CN112927795A

主分类号:G16H50/20(20180101)

分类号:G16H50/20(20180101);G16H50/70(20180101)

优先权:

专利状态码:有效-授权

法律状态:2022.09.23#授权;2021.06.25#实质审查的生效;2021.06.08#公开

摘要:本发明属于乳腺癌预测技术领域,尤其涉及基于bagging算法的乳腺癌预测方法,病例‑对照数据收集:基于乳腺癌防治相关知识设计调查问卷,问卷包含被认为对乳腺癌有影响的特征变量,通过该问卷收集来自中国三省一市25‑70岁122058名女性的乳腺疾病流行病学研究数据,记录病例‑对照数据备份,数据处理:对问卷收集来的数据进行数据清洗,删除重复信息以及缺失值或异常值过多的无效样本和特征变量。该基于bagging算法的乳腺癌预测方法,通过集成学习建立了一个有效的预测乳腺癌患病风险的模型,帮助医护人员预测处于乳腺癌的患者,及时并准确地对高危人群采取针对性的措施,这将有助于乳腺癌的辅助诊断和预防,为智能诊断作出贡献。

主权项:1.基于bagging算法的乳腺癌预测方法,其特征在于,包括以下步骤:S1、病例-对照数据收集基于乳腺癌防治相关知识设计调查问卷,问卷包含被认为对乳腺癌有影响的特征变量,通过该问卷收集来自中国三省一市122058名25-70岁女性的真实数据,记录病例-对照数据备份。S2、数据处理对问卷收集来的数据进行数据清洗,删除重复信息以及缺失值或异常值过多的无效样本和特征变量,选取合适的统一指标填充其余缺失值,处理后的全部特征变量作为模型的输入变量。S3、简单预测模型构建将步骤S2、数据处理中得到的样本数据集划分为样本训练集和样本验证集;对于样本训练集,通过bootstrap法采样获得T个采样集,分别建立惩罚逻辑回归乳腺癌预测模型,并分别对样本验证集进行预测。S4、模型融合在步骤S3、简单预测模型构建中,使用简单平均法,对T个惩罚逻辑回归乳腺癌预测模型得到的回归结果进行算术平均作为最终模型输出的乳腺癌预测概率,训练出最终预测模型。S5、筛选重要特征变量根据步骤S3、简单预测模型构建中的T个惩罚逻辑回归乳腺癌预测模型得到的每个特征变量的回归系数,使用合适的方式给予每个特征变量一个得分,根据得分,筛选出对乳腺癌预测影响最大的几个特征变量,来构成特征子集,作为模型的又一输入变量,重复步骤S3、S4,得到预测效果好且计算复杂度低的简化模型。S6、融合模型与其他经典模型预测性能分析与对比由步骤S2、数据处理中得到的样本训练集训练其他经典预测模型:Gail’s逻辑回归模型、BCARM,将步骤S4、模型融合中的预测结果与其他两种经典预测模型预测结果进行汇总,对AUC值进行比较,验证融合模型的预测表现是否优于其他模型。

全文数据:

权利要求:

百度查询: 山东大学 基于bagging算法的乳腺癌预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术