买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种分级式缩略语句匹配确认方法及系统_北京领初医药科技有限公司_202410040773.6 

申请/专利权人:北京领初医药科技有限公司

申请日:2024-01-11

公开(公告)日:2024-04-12

公开(公告)号:CN117555995B

主分类号:G06F16/33

分类号:G06F16/33;G06F16/335;G06F16/34

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2024.03.01#实质审查的生效;2024.02.13#公开

摘要:本发明提供了一种分级式缩略语句匹配确认方法及系统,涉及人工智能技术领域,包括步骤:构建缩略语数据库,输入文本,进行元素识别,并与所述缩略语数据库中的收录词条进行匹配;确定识别的元素在所述缩略语数据库中是否能匹配到对应的收录词条,确定识别的元素所匹配到的词条是否唯一,若唯一,将该元素直接认定为目标术语,若不唯一,将该元素认定为待定术语并通过机筛和人工方式确认其对应的唯一收录词条,若识别元素无法匹配,则进行查询,获取未收录术语所对应的未收录词条,更新至缩略语数据库中,导出文本缩略语文档。本发明使研究人员能够直观的了解到文本中出现的缩略语及其释义,方便使用文本缩略语文档与文本信息进行对照阅读。

主权项:1.一种分级式缩略语句匹配确认方法,其特征在于:S1:构建缩略语数据库,所述缩略语数据库包括多项收录词条,所述收录词条至少包括中文释义、英文释义及英文缩略语;S2:输入文本,进行元素识别,并与所述缩略语数据库中的收录词条进行匹配;确定识别的元素在所述缩略语数据库中是否能匹配到对应的收录词条;若是,则进入步骤S2.1,若否,则进入步骤S2.2;S2.1:确定识别的元素所匹配到的词条是否唯一,若唯一,将该元素直接认定为目标术语;若存在字符重叠的元素,即认定的目标术语包含在另一目标术语中,则增加判断机制;所述判断机制的方法为:设所识别的元素K1包括M个字符,将该元素的前后至少j个字符与元素K1的组合与所述缩略语数据库中的收录词条进行比对,判断是否存在收录在所述缩略语数据库中的包含所述元素K1的元素K2,若存在,则将所述元素K2认定为目标术语,且所述元素K1的出现频次减一;其中所述j的取值为大于等于1的整数;若不唯一,将该元素认定为待定术语,将所述待定术语及所涉及的所有收录词条均导出至待定缩略语文档中,根据语境并经逻辑判断由机器自主选择所述待定术语的初始认定词条;人工核实所述待定缩略语文档,针对所述待定术语选择其对应的正确的收录词条,并进行确认;确认完成后的所述待定术语转化为目标术语;初始认定词条的自主选择方法为:获取该待定术语所对应的N项收录词条,其中N≥2,并将其分别定义为第i待定词条,i=1,2,…,N,在所述文本的全文范围内搜索第i待定词条中的英文释义、中文释义及中文别称中至少一项的出现频次,并进行排序,将出现频次最多的第k待定词条判定为初始认定词条,其余词条在下拉列表中的排序根据频次由多到少进行排列;S2.2:将该元素认定为未收录术语,将未收录术语导出至未收录缩略语文档中,针对所述未收录术语进行查询,获取所述未收录术语所对应的未收录词条,人工核实所述未收录缩略语文档,并进行确认;将确认完成后的未收录词条补充至所述缩略语数据库中,并将该未收录术语转化为目标术语;S3:将目标术语的收录词条导出至文本缩略语文档中,记录出现频次。

全文数据:

权利要求:

百度查询: 北京领初医药科技有限公司 一种分级式缩略语句匹配确认方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。