申请/专利权人:之江实验室
申请日:2022-12-12
公开(公告)日:2023-03-21
公开(公告)号:CN115827844A
主分类号:G06F16/332
分类号:G06F16/332;G06F16/36;G06F40/295
优先权:
专利状态码:有效-授权
法律状态:2023.08.08#授权;2023.04.07#实质审查的生效;2023.03.21#公开
摘要:一种基于Sparql语句生成的知识图谱问答方法,包括:将本体层的知识图谱和实例层的知识图谱映射到向量空间,学习每个概念、实体和关系的向量表示;通过命名实体识别算法识别出自然语言查询语句中的所有实体,并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体;在训练集中检索K个与查询问题相似的问题以及相应的Sparql语句;对问题和候选Sparql语句信息集进行编码,并采用多头注意力机制融合它们的信息;获取基于问题的本体编码,检索基于问题的本体子图以及相应的编码,并融合信息;采用transformer的Decoder部分作为生成模型,使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句;执行生成的Sparql语句,查询并返回问题的答案。
主权项:1.一种基于Sparql语句生成的知识图谱问答方法,其特征在于,该方法包括以下步骤:步骤一:采用知识图谱嵌入模型JOIE-TransE-CT将本体层的知识图谱和实例层的知识图谱映射到向量空间,学习每个概念、实体和关系的向量表示。步骤二:通过命名实体识别算法识别出自然语言查询语句中的所有实体,并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体。步骤三:在训练集中检索K个查询语句的相似问题以及相应Sparql语句。步骤四:对问题和候选Sparql语句信息集进行编码,并采用多头注意力机制融合它们的信息。步骤五:获取基于问题的本体编码,检索基于问题的本体子图以及相应的编码,对它们的信息进行融合。步骤六:采用transformer的Decoder部分作为生成模型,使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句。步骤七:执行步骤六中生成的Sparql语句,查询并返回问题的答案。
全文数据:
权利要求:
百度查询: 之江实验室 一种基于Sparql语句生成的知识图谱问答方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。