申请/专利权人:国际商业机器公司
申请日:2019-08-30
公开(公告)日:2024-04-16
公开(公告)号:CN110931084B
主分类号:G16B20/50
分类号:G16B20/50;G16B30/00;G16B40/00;G16B50/00;G06F40/295;G06F40/30;G06F40/247;G06F16/33
优先权:["20180831 US 16/119,480"]
专利状态码:有效-授权
法律状态:2024.04.16#授权;2020.04.21#实质审查的生效;2020.03.27#公开
摘要:从非结构化文本提取和标准化突变基因用于认知搜索和分析。提供用于从至少一组非结构化文本自动提取和标准化至少一个突变基因实体的方法、计算机系统和计算机程序产品。本发明可包括提取描述第一实体和第二实体的非结构化文本。然后,本发明可包括识别特定第一实体和特定第二实体。本发明还可包括将特定第一实体和特定第二实体相关联。本发明还可包括创建突变基因实体。然后,本发明可包括识别创建的突变基因实体与一个或多个第三实体之间的至少一个语义关系。本发明还可包括将与特定第一实体和特定第二实体相关联的至少一组数据、语义关系和创建的突变基因实体存储在数据库中。
主权项:1.一种用于从至少一组非结构化文本自动提取和标准化至少一个突变基因实体的方法,所述方法包括:提取描述第一实体和第二实体的所述至少一组非结构化文本;识别在所提取的所述至少一组非结构化文本中描述的至少一个特定第一实体和至少一个特定第二实体,其中通过执行命名实体解析分别将所述至少一个特定第一实体和所述至少一个特定第二实体标准化并表示为相同的概念;将所识别的所述至少一个标准化的特定第一实体与对应的所识别的所述至少一个标准化的特定第二实体相关联;通过合并与所关联的所述至少一个标准化的特定第一实体和对应的所关联的所述至少一个标准化的特定第二实体相关联的至少一组数据来创建所述至少一个突变基因实体;识别所创建的所述至少一个突变基因实体与一个或多个第三实体之间的至少一个语义关系;以及将所合并的与所关联的所述至少一个标准化的特定第一实体和所关联的所述至少一个标准化的特定第二实体相关联的所述至少一组数据、所识别的所述至少一个语义关系以及所创建的所述至少一个突变基因实体存储在注释存储数据库中。
全文数据:
权利要求:
百度查询: 国际商业机器公司 从非结构化文本提取和标准化突变基因用于认知搜索和分析
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。