买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于Sparql语句生成的知识图谱问答方法和系统_之江实验室_202211609811.2 

申请/专利权人:之江实验室

申请日:2022-12-12

公开(公告)日:2023-08-08

公开(公告)号:CN115827844B

主分类号:G06F16/332

分类号:G06F16/332;G06F16/36;G06F40/295

优先权:

专利状态码:有效-授权

法律状态:2023.08.08#授权;2023.04.07#实质审查的生效;2023.03.21#公开

摘要:一种基于Sparql语句生成的知识图谱问答方法,包括:将本体层的知识图谱和实例层的知识图谱映射到向量空间,学习每个概念、实体和关系的向量表示;通过命名实体识别算法识别出自然语言查询语句中的所有实体,并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体;在训练集中检索K个与查询问题相似的问题以及相应的Sparql语句;对问题和候选Sparql语句信息集进行编码,并采用多头注意力机制融合它们的信息;获取基于问题的本体编码,检索基于问题的本体子图以及相应的编码,并融合信息;采用transformer的Decoder部分作为生成模型,使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句;执行生成的Sparql语句,查询并返回问题的答案。

主权项:1.一种基于Sparql语句生成的知识图谱问答方法,其特征在于,该方法包括以下步骤:步骤一:采用知识图谱嵌入模型JOIE-TransE-CT将本体层的知识图谱和实例层的知识图谱映射到向量空间,学习每个概念、实体和关系的向量表示;在本体层和实例层之间,三元组数据主要通过类别信息相互连接,实体的类别信息作为本体概念的一部分,因此在本体层O和实例层I之间,旨在通过学习本体和对应实例的类属关系,任务本体和相应的实例通过一种非线性映射关系来链接,映射后的实体要求与它所属类别的位置距离相近,并远离不属于的类别O′t,因此通过如下损失函数Lintra更新本体类别向量Ot和实体的向量Ie: 其中fIe=σW0·Ie+b0,α为超参数,S为知识图谱中所有实例和本体中类别相关联的所有的三元组;在知识图谱数据集中,对每个实例的type都进行了完整的标注,对于每一个类别,考虑可以通过其类别下的所有实例进行完全映射,因此同样通过以下损失函数对本体类别向量Ot和实体向量Ie进行更新: 其中为所有类别为Ot实例向量平均值;而对于知识图谱中的每个视图中的三元组,正确三元组h,l,t和负采样的错误三元组h′,l′,t′,通过损失函数Li在每个mini-batch更新的实体h、t和关系l的向量: 其中fh,r,t=-||h+r-t||2,为知识图谱;通过对以上的所有损失函数相加对知识图谱嵌入模型进行训练,获取到预训练好的知识图谱嵌入;步骤二:通过命名实体识别算法识别出自然语言查询语句中的所有实体,并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体;步骤三:在训练集中检索K个查询语句的相似问题以及相应Sparql语句;步骤四:对问题和候选Sparql语句信息集进行编码,并采用多头注意力机制融合它们的信息;步骤五:获取基于问题的本体编码,检索基于问题的本体子图以及相应的编码,对它们的信息进行融合;步骤六:采用transformer的Decoder部分作为生成模型,使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句;步骤七:执行步骤六中生成的Sparql语句,查询并返回问题的答案。

全文数据:

权利要求:

百度查询: 之江实验室 一种基于Sparql语句生成的知识图谱问答方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。