买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于虚拟数据增强的眼科疾病诊疗意见生成方法、系统、介质和设备_暨南大学_202310233482.4 

申请/专利权人:暨南大学

申请日:2023-03-13

公开(公告)日:2024-02-06

公开(公告)号:CN116259422B

主分类号:G16H70/20

分类号:G16H70/20;G16H50/50;G16H50/70;G16H50/20;G16H15/00;G06F16/35;G06F16/335;G06F40/242;G06F40/216;G06F40/284;G06N3/08;G06N3/0455;G06N3/0475

优先权:

专利状态码:有效-授权

法律状态:2024.02.06#授权;2023.06.30#实质审查的生效;2023.06.13#公开

摘要:本发明公开了一种基于虚拟数据增强的眼科疾病诊疗意见生成方法、系统、介质和设备,该方法的步骤包括:获取医疗文本数据并进行预处理;构建语料库,基于语料库预训练BERT模型;基于BERT模型进行多标签文本分类,输出对应的疾病分类;将医疗文本数据训练集根据不同的疾病种类进行划分,得到训练子集;采用Seq2seq结构构建眼科疾病的诊疗意见生成模型;基于训练子集训练诊疗意见生成模型;构建并训练双塔结构的眼科疾病诊疗意见生成模型;将医疗文本数据输入至训练后的双塔结构的眼科疾病诊疗意见生成模型,输出眼科疾病诊疗意见。本发明能够有效扩增训练样本的特征空间,提升眼科疾病诊疗意见的生成质量。

主权项:1.一种基于虚拟数据增强的眼科疾病诊疗意见生成方法,其特征在于,包括下述步骤:在医疗电子病历系统中筛选获取医疗文本数据,对医疗文本数据进行预处理;利用公开发表的眼科中文文献摘要构建语料库,以BERT深度神经网络为基础构建BERT模型,基于语料库预训练BERT模型;基于BERT模型进行多标签文本分类,每个输入文本对应一个或多个疾病诊断,使用多个全连接层连接Softmax激活函数作为输出,将输出映射为相应的疾病;将医疗文本数据训练集根据不同的疾病种类进行划分,得到训练子集,每一个训练子集将对应着一种眼科疾病,相同疾病训练样本的特征分布空间一致;构建眼科疾病的诊疗意见生成模型,所述诊疗意见生成模型采用Seq2seq的结构,Seq2seq结构由一个Encoder端和Decoder端构成,预训练BERT模型作为疾病诊疗意见自动生成模型的Encoder端,Encoder端用于将输入的文本数据进行编码、压缩,并提取相应的疾病特征,Decoder端用于解码,并生成对应的诊疗意见,所述Decoder端采用多层随机初始化堆叠的Transformer网络;基于不同的眼科疾病对应的训练子集训练诊疗意见生成模型;所述基于不同的眼科疾病对应的训练子集训练诊疗意见生成模型,利用Dropout算法,以欧几里得相似度作为正则项优化模型损失;双塔结构的眼科疾病诊疗意见生成模型在每个诊疗意见生成网络结构中添加Dropout算法,采用统一的损失函数,具体表示为: Loss=lossmodel1+lossmodel2+βEq,p 其中,model1和model2表示两个结构相同的诊疗意见生成网络,q和p分别表示双塔模型训练输出,β表示欧几里得相似度权重,y表示标准参考诊疗意见,pi表示诊疗意见生成模型输出,M表示样本数量;将单一的诊疗意见生成模型的结构复刻为双塔的形式,构建并训练双塔结构的眼科疾病诊疗意见生成模型;将医疗文本数据输入至训练后的双塔结构的眼科疾病诊疗意见生成模型,输出眼科疾病诊疗意见。

全文数据:

权利要求:

百度查询: 暨南大学 基于虚拟数据增强的眼科疾病诊疗意见生成方法、系统、介质和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。