买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于UCL知识空间的实体消歧方法及装置_东南大学_202110475291.X 

申请/专利权人:东南大学

申请日:2021-04-29

公开(公告)日:2024-04-16

公开(公告)号:CN113111136B

主分类号:G06F16/28

分类号:G06F16/28;G06N3/049;G06N3/08;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.07.30#实质审查的生效;2021.07.13#公开

摘要:本发明提供了一种基于UCL知识空间的实体消歧方法及装置,首先构建基础知识库,完成UCL知识空间的构建;随后从UCL知识空间中获取待消歧实体相关的候选实体集合,利用词向量表示方法生成候选实体和待消歧实体的嵌入表示;接着抽取待消歧实体及其上下文的概念特征,抽取候选实体上下文的特征;最后利用之前生成的四个向量表示作为输入,采用基于深度结构化语义匹配模型DSSM的自注意力匹配网络,获得匹配度;根据匹配结果的排序得到最终消歧结果,完成文本中实体与UCL知识空间中实体的实体链接。本发明既能够解决短文本中实体相关信息较少的问题,还能提高实体消歧的准确度。

主权项:1.一种基于UCL知识空间的实体消歧方法,其特征在于,包括如下步骤:1UCL知识空间构建:利用信息抽取相关技术从开放的离线数据库中获取实体、实体基础属性以及实体间关联,构建基础知识库;获取网络新闻,利用UCL标引网络新闻,计算出实体与新闻的关联,作为知识库的补充,完成UCL知识空间的构建;2向量表示生成:从UCL知识空间中获取待消歧实体相关的候选实体集合,利用词向量表示方法生成候选实体和待消歧实体的嵌入表示,作为步骤4中语义匹配模块的输入;3特征抽取:不仅考虑文本本身的内容信息,还通过引入外部知识对于文本进行补充;第一阶段抽取待消歧实体及其上下文的概念特征,第二阶段抽取候选实体上下文的特征;4语义匹配:利用步骤3中生成的待消歧实体的概念化嵌入、候选实体的上下文嵌入以及步骤2中生成的候选实体与待消歧实体本身的词向量嵌入共四个向量表示作为输入,采用基于深度结构化语义匹配模型DSSM的自注意力匹配网络,获得匹配度;根据匹配结果的排序得到最终消歧结果,完成文本中实体与UCL知识空间中实体的实体链接,进而更新UCL知识空间内容。

全文数据:

权利要求:

百度查询: 东南大学 一种基于UCL知识空间的实体消歧方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。