买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于电子病历文本的手术费用识别方法、装置及存储介质_之江实验室_202410056657.3 

申请/专利权人:之江实验室

申请日:2024-01-16

公开(公告)日:2024-04-09

公开(公告)号:CN117574896B

主分类号:G06F40/289

分类号:G06F40/289;G06F40/242;G06F40/247;G16H10/60

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2024.03.08#实质审查的生效;2024.02.20#公开

摘要:本发明涉及一种基于电子病历文本的手术费用识别方法、装置及存储介质,其中方法包括:步骤S1:获取标准手术词集合,并构建标准手术词集合的超集;步骤S2:将非结构化的电子病历文本预处理,得到和手术相关的片段,并对各片段进行分词,分别得到关联于各片段的单词序列;步骤S3:将单词序列输入至训练好的手术词生成模型,生成原始手术词序列;步骤S4:对所有原始手术词进行合并,得到多个原始手术词集合;步骤S5:基于原始手术词集合构建手术词树;步骤S6:将手术词树中的节点映射至标准手术词,并将根节点的所有第一级子节点所映射的标准手术词的费用之和作为识别结果。与现有技术相比,本发明具有准确率高等优点。

主权项:1.一种基于电子病历文本的手术费用识别方法,其特征在于,包括:步骤S1:获取标准手术词集合,并构建标准手术词集合的超集,其中,所述标准手术词集合的超集中包含与各标准手术词同义的非标准手术词;步骤S2:将非结构化的电子病历文本预处理,得到和手术相关的片段,并对各片段进行分词,分别得到关联于各片段的单词序列;步骤S3:将单词序列输入至训练好的手术词生成模型,生成原始手术词序列,其中,所述手术词生成模型的输入为单词序列,输出为由多个原始手术词组成的原始手术词序列,原始手术词为所述超集中的元素;步骤S4:对所有原始手术词进行合并,得到多个原始手术词集合,其中,每个原始手术词集合中,若该原始手术词集合存在两个及以上的手术词,则对于任一原始手术词,至少存在另一个原始手术词与所述任一原始手术词的关系为并列、等价、修饰或被修饰;步骤S5:基于原始手术词集合构建手术词树,其中,所述手术词树中,除根节点以外,各节点均对应一个原始手术词集合,任一节点被其上一级母节点包含,并包含下一级的所有子节点;步骤S6:将手术词树中的节点映射至标准手术词,并将根节点的所有第一级子节点所映射的标准手术词的费用之和作为识别结果;所述手术词生成模型生成原始手术词序列的过程具体包括:步骤S3-2-1:设置滑动窗口的起点指针start=1,终点指针end=|t|,位置指针p=start,其中t为单词序列;步骤S3-2-2:沿单词序列从起点位置向终点位置移动位置指针,获取由子序列tstart:p=[tstart,…,tp]生成的手术词概率最大时位置指针的位置;步骤S3-2-3:将由子序列tstart:p生成的手术词作为一个原始手术词;步骤S3-2-4:以当前位置指针的位置作为切割点,将单词序列进行切割,得到两个新的单词序列,并对得到的所有单词序列,重复步骤S3-2-1至S3-2-3,生成多个原始手术词;步骤S3-2-4:将所有原始手术词拼接组成原始手术词序列;所述步骤S3-2-2中,手术词的概率具体为: p=argmaxstart≤p≤endPq│tstart:p q=Modelgtstart:p其中:p为位置指针,P为概率,Modelg为手术词生成模型,q为手术词生成模型以单词序列中起点指针到位置指针的子序列为输入生成的手术词。

全文数据:

权利要求:

百度查询: 之江实验室 基于电子病历文本的手术费用识别方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。