买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于GCN与指针网络的自然语言到SPARQL语句的生成系统及方法_西安交通大学_202011642734.1 

申请/专利权人:西安交通大学

申请日:2020-12-30

公开(公告)日:2023-01-03

公开(公告)号:CN112632263B

主分类号:G06F16/332

分类号:G06F16/332;G06F16/33;G06F16/36;G06F40/284;G06F40/30;G06N3/04;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2023.01.03#授权;2021.04.27#实质审查的生效;2021.04.09#公开

摘要:本发明提供的一种基于GCN与指针网络的自然语言到SPARQL语句的生成系统及方法,包括以下步骤:获取问题语句图;利用GCN神经网络模型对得到的问题语句图进行训练,获得问题语句图中每个节点对应的图嵌入向量;搭建指针网络架构,使用指针网络架构生成SPARQL语句,实现端到端生成,避免中间环节,降低了SPARQL语句生成复杂度;提升了解码端问句生成灵活度。

主权项:1.一种基于GCN与指针网络的自然语言到SPARQL语句的生成方法,其特征在于,包括以下步骤:步骤1,接收用户问题语句;步骤2,根据用户问题语句获取问题语句图;步骤3,利用GCN神经网络模型对步骤2中得到的问题语句图进行训练,获得问题语句图中每个节点对应的图嵌入向量;步骤4,搭建指针网络架构,所述指针网络架构包括编码端、Attention层和解码端,其中,编码端为Bi-LSTM模型;解码端为LSTM模型;Attention层包括全连接层和Softmax层;构建输入序列,并设定该输入序列的单元数为n;步骤5,对步骤4中得到的输入序列进行编码,得到输入序列编码向量;将输入序列编码向量与步骤3中得到的图嵌入向量进行拼接,得到编码拼接向量;将得到的编码拼接向量输入步骤4中得到的指针网络架构的编码端,获得Bi-LSTM模型n个单元输出向量、1个正向隐向量和1个反向隐向量;步骤6,根据步骤5得到的Bi-LSTM模型单元输出向量、正向隐向量和反向隐向量,结合步骤4中得到指针网络架构的Attention层,得到输入序列每个单元的权重;根据得到的最大权重对应的输入序列单元,结合步骤4中得到指针网络架构的解码端,生成SPARQL语句;步骤2中,根据用户问题语句获取问题语句图,具体方法是:S201、利用BERT+CRF模型对接收到的问题语句分别进行实体识别和属性识别,分别得到实体信息和属性信息;S202、利用知识图谱获取S201中得到的实体信息和属性信息对应的子图,并将该子图作为问题语句图;步骤6中,根据步骤5得到的单元输出向量、正向隐向量和反向隐向量,结合步骤4中得到指针网络架构的Attention层,得到输入序列每个单元的权重,具体方法是:S601、将步骤5得到的正向隐向量和反向隐向量进行拼接,获得1个拼接向量;S602,将S601中获得的拼接向量进行复制,其数量与步骤4中设定的输入序列的单元数的数量相同,得到n个拼接向量;S603,将得到的n个拼接向量与步骤5得到的n个单元输出向量分别进行一一拼接,获得n个新拼接向量;S604、将S603中获得的n个新拼接向量分别输入步骤4中Attention层中的n个全连接层,获得n个全连接层向量;S605、将S604中获得的n个全连接层向量输入步骤4中Attention层中的Softmax层,得到输入序列中的每个单元的权重;步骤6中,根据得到的最大权重对应的输入序列单元,结合步骤4中得到指针网络架构的解码端,生成SPARQL语句,具体方法是:S606、将得到的最大权重对应的输入序列单元作为输出序列初始单元;S607、在步骤5中得到的n个单元输出向量中获取S606获得的输出序列初始单元所对应的单元输出向量,并将该对应的单元输出向量与S601获得的拼接向量输入至解码端的初始单元,获得初始单元输出隐向量;S608、将S607获得的初始单元输出隐向量作为S601中的拼接向量,重复S602—S607步骤,直到最大权重对应的输入序列单元为标识符end,指针网络架构解码结束,汇总输出序列所有单元输出即为最终生成的SPARQL语句。

全文数据:

权利要求:

百度查询: 西安交通大学 一种基于GCN与指针网络的自然语言到SPARQL语句的生成系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。