买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于HF-GAN的心脏病诊断缺失数据填补方法及系统_长春师凯科技产业有限责任公司;长春理工大学;吉林大学第一医院_202410263338.X 

申请/专利权人:长春师凯科技产业有限责任公司;长春理工大学;吉林大学第一医院

申请日:2024-03-08

公开(公告)日:2024-04-09

公开(公告)号:CN117854716A

主分类号:G16H50/20

分类号:G16H50/20;G06N3/094

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明属于医学数据处理技术领域,公开了基于HF‑GAN的心脏病诊断缺失数据填补方法及系统。该方法对系统初始化和配置的训练数据集以及测试数据集进行数据预处理;基于数据预处理后的数据,构建特征属性矩阵,并利用属性矩阵直接将医学疾病缺失数据转换为实值型、二值型或标称型数据,生成逼近真实数据的数据;构建并训练生成对抗网络,利用所述生成对抗网络对医学疾病缺失数据进行填补;对所述利用生成对抗网络对医学疾病缺失数据进行填补性能进行评估。本发明生成新的多样化数据实例,保证数据合理性的同时,增加数据的丰富性和复杂性。本发明提高了数据可解释性和实际应用价值,确保生成数据的有效性。

主权项:1.一种基于HF-GAN的心脏病诊断缺失数据填补方法,其特征在于,该方法包括:S1,对系统初始化和配置的训练数据集以及测试数据集进行数据预处理;S2,基于数据预处理后的数据,构建属性矩阵,并利用属性矩阵直接将医学疾病缺失数据转换为实值型、二值型或标称型数据,构建并训练生成对抗网络,利用所述生成对抗网络对医学疾病缺失数据进行填补,生成逼近真实数据的分布形式;S3,利用生成对抗网络对医学疾病缺失数据进行填补性能进行评估;所述对系统初始化和配置的训练数据集以及测试数据集进行数据预处理包括:第一步,ECG数据导入:使用‘readData.ReadPhysionetData’从指定路径加载训练数据集,使用‘readTestData.ReadPhysionetData’从指定路径加载测试数据集;其中,‘readTestData.ReadPhysionetData’为从数据库读取数据函数的方法;第二步,数据预处理,采用的方法为:最大最小归一化,可变分数阶梯度下降法;所述最大最小归一化的表达式为: ;式中,为经过归一化处理后的数据值,在[0,1]区间内;分别为第维属性的最大值和最小值,为未丢失可观测的数据;所述可变分数阶梯度下降法包括:将Caputo分数阶导数的公式扩展,表达式为: ;式中,为Caputo分数阶导数,为数据样本总数,为第某个样本,为分数阶导数的阶次,为输入函数的阶导数,为伽马函数,为时间,为起始时刻;迭代方法如下: ;式中,为时间点,为时间点,为不同时间学习率差值,为学习率,为Caputo分数阶导数的标记,为时间的输入值,为正整数,为离散时间序列的某节点;所述利用属性矩阵直接将医学疾病缺失数据转换为实值型、二值型或标称型数据,构建并训练生成对抗网络,利用所述生成对抗网络对医学疾病缺失数据进行填补,生成逼近真实数据的分布形式包括:给定包含个数据样本的原始数据的数据集为,每个样本有维属性值数为;为第个数据样本的原始数据,为矩阵转置符号,为第个数据样本的第维的属性值数;利用缺失标记矩阵确定原始数据的数据集缺失数据的信息,矩阵中的元素由以下公式产生: ;式中,为第个样本的第维属性值缺失,为未丢失可观测的数据,为表示单元格中缺失数值,为第某个样本,为第某个维度,为数据样本总数;特征属性包含实值型、二值型、标称型,将实值型、二值型、标称型分别设置为0,1,2,属性矩阵用来标记数据的属性信息,表达式为: ;式中,为的数据类型,为数组中不重复的元素按照升序进行排列后形成的新数组的形状。

全文数据:

权利要求:

百度查询: 长春师凯科技产业有限责任公司;长春理工大学;吉林大学第一医院 基于HF-GAN的心脏病诊断缺失数据填补方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。