买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种获取电子病历文本的疾病名称标识的数据处理系统_奇点智保(北京)科技有限公司_202410108326.X 

申请/专利权人:奇点智保(北京)科技有限公司

申请日:2024-01-25

公开(公告)日:2024-04-12

公开(公告)号:CN117874235A

主分类号:G06F16/35

分类号:G06F16/35;G06F40/216;G06F40/194;G16H10/60

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:本发明涉及数据处理领域,尤其涉及一种获取电子病历文本的疾病名称标识的数据处理系统,当计算机程序被处理器执行时,实现以下步骤:基于初始关键词的词向量和主类疾病名称对应的主关键词的词向量之间的相似度,筛选得到第一候选疾病名称列表并去重得到第一中间疾病名称列表,从而结合初始关键词和主类关键词之间的相似度,以及初始关键词在病历文本中的出现次数获取到第一疾病名称标识列表,提高了第一疾病名称标识的获取准确性;然后结合初始关键词的词向量、第一疾病名称标识列表、第一副类疾病名称信息列表和第二副类疾病名称信息列表,进一步获取到电子病历文本对应的目标病历名称标识,提高了目标病历名称标识的获取准确性。

主权项:1.一种获取电子病历文本的疾病名称标识的数据处理系统,其特征在于,所述系统包括处理器和存储有计算机程序的存储器,所述存储器中还存储有电子病历文本的初始关键词向量集A0={A01,A02,……,A0i,……,A0m}、主类疾病名称信息列表L0、第一副类疾病名称信息列表L1和第二副类疾病名称信息列表L2,其中,A0i是指所述电子病历文本的第i个初始关键词的词向量,L0包括n个预设的主类疾病名称、每一主类疾病名称对应的主类疾病名称标识以及主类疾病名称向量集B0={B01,B02,……,B0j,……,B0n},B0j是指第j个主类疾病名称对应的主关键词的词向量,i=1,2,……,m,m是指所述电子病历文本的初始关键词的总数量,j=1,2,……,n,当所述计算机程序被处理器执行时,实现以下步骤:S100,根据A0和B0,获取到A0对应的主类疾病名称相似度集C0={C01,C02,……,C0i,……,C0m},其中,C0i={C0i1,C0i2,……,C0ij,……,C0in},C0ij是指A0i和B0j之间的相似度;S200,将满足C0ij>△C0的C0ij对应的主类疾病名称作为第一候选疾病名称,获取到第一候选疾病名称列表D0,其中,△C0为第一预设阈值;S300,对D0去重得到第一中间疾病名称列表D1={D11,D12,……,D1k,……,D1t},其中,D1k是指第k个第一中间疾病名称,k=1,2,……,t,t为第一中间疾病名称的总数量;S400,根据C0和D1,获取到D1对应的主类疾病名称中间相似度集C1={C11,C12,……,C1k,……,C1t},其中,C1k={C1k1,C1k2,……,C1kx,……,C1krk},C1kx是指D1k对应的主类疾病名称在C0中对应的大于△C0的第x个主类疾病名称相似度,x=1,2,……,rk,rk是指D1k对应的主类疾病名称在C0中对应的大于△C0的主类疾病名称相似度的总数量;S500,根据C1和A0,获取到D1对应的第一出现频次集E1={E11,E12,……,E1k,……,E1t},其中,E1k={E1k1,E1k2,……,E1kx,……,E1krk},E1kx=Q1kxm,Q1kx为C1kx对应的初始关键词的词向量在A0中的出现次数;S600,根据C1和E1,获取到D1对应的第一选取概率集S1={S11,S12,……,S1k,……,S1t},其中,D1k对应的第一选取概率S1k=Σx=1rkE1kx*C1kxrk;S700,将满足S1k>△S1的S1k对应的第一中间疾病名称对应的主类疾病名称标识作为第一疾病名称标识,获取到第一疾病名称标识列表W1,其中,△S1为第二预设阈值;S800,根据A0、W1、L1和L2,获取到所述电子病历文本对应的目标病历名称标识。

全文数据:

权利要求:

百度查询: 奇点智保(北京)科技有限公司 一种获取电子病历文本的疾病名称标识的数据处理系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。