买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于深度学习的耳疾电子病历解析方法_天津大学;中电云脑(天津)科技有限公司_202311620641.2 

申请/专利权人:天津大学;中电云脑(天津)科技有限公司

申请日:2023-11-30

公开(公告)日:2024-04-09

公开(公告)号:CN117316372B

主分类号:G16H15/00

分类号:G16H15/00;G06F40/279;G06N3/0442

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2024.01.16#实质审查的生效;2023.12.29#公开

摘要:本发明公开了一种基于深度学习的耳疾电子病历解析方法,涉及到医学领域,包括以下步骤:S1:数据的输入和预处理;获取真实电子病历文本数据,进行预处理;S2:Schema定义;定义外部实体类别和内部实体类别,将外部实体类别和内部实体类别作为病历语料库中重要的信息;S3:实体识别模型基于堆叠的平面实体识别层而设计;当词向量+字符向量输入到第一层时,该识别层进行实体类别的识别;若识别出外部实体,则其对应的表示向量不参与后续传递,用于外部实体提取;若识别出内部实体,则将内部实体生成内部实体表示向量,用于内部实体的提取,本发明针对中文以及医疗领域的特点,提出了一种多层堆叠的实体识别方法,可以有效的解决嵌套实体识别的问题。

主权项:1.一种基于深度学习的耳疾电子病历解析方法,其特征在于:包括以下步骤:S1:数据的输入和预处理:获取真实电子病历文本数据,进行预处理,得到词向量+字符向量的组合;S2:Schema定义:基于病历语料库中的重要信息,定义外部实体类别和内部实体类别;S3:建立实体识别模型:实体识别模型基于堆叠的平面实体识别层而设计;当词向量+字符向量输入到第一层时,该识别层进行实体类别的识别;若识别出外部实体,则其对应的表示向量不参与后续传递,识别出外部实体则可以将对应的表示向量提取封存,用于外部实体提取;若识别出内部实体,则将内部实体生成内部实体表示向量,用于内部实体的提取;之后将该层未识别出实体类别的字符,保留为原始表示向量,并与本层识别出的内部实体表示向量一起传递到下一识别层;实体识别模型在后续每个识别层内重复上述外部实体识别和内部实体识别及传递的识别步骤,直至某一层的识别结果均为“0”;则表示所有的内部实体和外部实体均已识别完成;此时,停止模型堆叠,完成全部内部实体和外部实体的识别工作;S4:结构化输出:将识别出来的内部实体和外部实体,结合步骤S2中定义的schema,形成结构化数据;所述S3中,实体识别模型每层均采用LSTM+CRF组成的识别层进行识别工作;内部实体表示向量生成方式如下:将识别出的内部实体合并,并且计算内部实体的上下文向量表示的平均值,对识别出的内部实体中包含的每个字符的向量平均后,将每个识别出的内部实体视为一个词,并标记为内部实体表示向量;所述S1中数据的预处理包括:通过word2vec模型预训练的词向量表将每个词映射成一个词向量,然后使用原始文本来训练word2vec模型获得字符嵌入并将每个字符映射到一个字符向量中,最后预处理的结果是词向量+字符向量的组合,以便更好的利用语义信息和句法信息。

全文数据:

权利要求:

百度查询: 天津大学;中电云脑(天津)科技有限公司 一种基于深度学习的耳疾电子病历解析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。