买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种实体关联方法、装置、电子设备及存储介质_北京明略软件系统有限公司_202110582345.2 

申请/专利权人:北京明略软件系统有限公司

申请日:2021-05-27

公开(公告)日:2021-09-17

公开(公告)号:CN113032584B

主分类号:G06F16/36(20190101)

分类号:G06F16/36(20190101);G06K9/62(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.09.17#授权;2021.07.13#实质审查的生效;2021.06.25#公开

摘要:本申请提供了一种实体关联方法、装置、电子设备及存储介质,属于数据分析技术领域。所述实体关联方法包括:基于待检测文档中的文档实体列表,获取知识图谱数据库中与所述文档实体列表中的每个文档实体相对应的每个匹配实体以及与每个所述匹配实体相关联的关系实体;根据所述待检测文档和所述匹配实体属性,确定第一相似度;根据所述待检测文档的所述文本摘要和所述匹配实体,确定第二相似度;根据所述待检测文档的所述文本摘要、所述匹配实体以及所述关系实体,确定第三相似度。本申请可以有效的提高实体关联的准确率和召回率,且可以在前端展示的时候能够直接展示关联的类别,提高实体的类别或场景关联能力。

主权项:1.一种实体关联方法,其特征在于,所述实体关联方法包括:获取待检测文档中的文档实体列表和所述待检测文档的文本摘要,其中,所述文本摘要通过排序算法确定;基于待检测文档中的文档实体列表,获取知识图谱数据库中与所述文档实体列表中的每个文档实体相对应的每个匹配实体以及与每个所述匹配实体相关联的关系实体;其中,每个所述匹配实体包括匹配实体名称、匹配实体属性以及匹配实体关系,每个所述关系实体包括关系实体名称和关系实体属性;根据所述待检测文档和所述匹配实体属性,确定第一相似度;根据所述待检测文档的所述文本摘要和所述匹配实体,确定第二相似度;根据所述待检测文档的所述文本摘要、所述匹配实体以及所述关系实体,确定第三相似度;针对所述文档实体列表中每个所述文档实体相对应的每个所述匹配实体的所述第一相似度、所述第二相似度以及所述第三相似度按照相似度比例配置权重系数,并按照配置后的所述权重系数对每个所述匹配实体的所述第一相似度、所述第二相似度以及所述第三相似度进行求和,并在多个所述匹配实体中确定一个匹配实体的相似度最大值;其中,所述权重系数的配置比例根据属性分类的不同情况确定;将所述匹配实体的所述相似度最大值与预设阈值进行对比,并将所述最大值大于所述预设阈值的所述待检测文档中的文档实体与所述知识图谱数据库关联,并获取该文档实体与所述知识图谱数据库中相关联的关系实体以及所述关系实体的实体类别;所述根据所述待检测文档和所述匹配实体属性,确定第一相似度,包括:将所述文档实体列表中每个文档实体所在的句子进行分割,并对所述句子进行分类,获取所述句子的词向量集合;获取所述匹配实体属性的词向量集合;根据所述句子的词向量集合与所述匹配实体属性的词向量集合,确定所述句子类别与所述匹配实体属性的相似度为第一相似度;其中,若所述匹配实体中的任一一个匹配实体的类别与分割后的任一一个所述句子的类别相同,则将所述第一相似度按照相似度比例配置为最大的权重系数;所述根据所述待检测文档的所述文本摘要和所述匹配实体,确定第二相似度,包括:根据所述文本摘要的类别,确定所述文本摘要的摘要向量;基于所述匹配实体的匹配实体名称和匹配实体关系,确定所述匹配实体关系的词向量集合;根据所述文本摘要的摘要向量与所述匹配实体关系的词向量集合,确定所述文本摘要与所述匹配实体的相似度为第二相似度;其中,若所述匹配实体中的任一一个匹配实体的类别与所述文本摘要的类别相同,则将所述第二相似度按照相似度比例配置为最大的权重系数;所述根据所述待检测文档的所述文本摘要、所述匹配实体以及所述关系实体,确定第三相似度,包括:基于所述匹配实体的匹配实体名称和匹配实体关系以及所述关系实体的关系实体名称和关系实体属性,确定所述匹配实体的词向量集合;根据所述文本摘要的摘要向量与所述匹配实体的词向量集合,确定所述文本摘要与所述匹配实体的相似度为第三相似度;其中,若所述匹配实体中的任一一个匹配实体的类别与所述匹配实体对应的关系实体的类别均和所述文本摘要的类别相同,则将所述第三相似度按照相似度比例配置为最大的权重系数。

全文数据:

权利要求:

百度查询: 北京明略软件系统有限公司 一种实体关联方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。