买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种面向开放域的实体关系抽取方法、装置及终端设备_广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司_202010540594.0 

申请/专利权人:广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司

申请日:2020-06-12

公开(公告)日:2024-04-09

公开(公告)号:CN111831829B

主分类号:G06F16/36

分类号:G06F16/36;G06F40/211;G06F40/253;G06F40/295;G06F40/30;G06F16/35;G06N5/025;G06N3/045;G06N3/0464;G06N3/09

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2020.11.13#实质审查的生效;2020.10.27#公开

摘要:本发明涉及计算机自然语言处理技术领域,公开了一种面向开放域的实体关系抽取方法、装置及终端设备,所述方法包括:获取待处理的开放域数据;将所述开放域数据输入训练好的实体关系抽取模型,获得所述开放域数据中的实体关系;其中,所述实体关系抽取模型采用有监督学习算法进行训练。本发明提供的一种面向开放域的实体关系抽取方法、装置及终端设备,能够提高面向开放域的实体关系抽取结果的准确率。

主权项:1.一种面向开放域的实体关系抽取方法,其特征在于,所述方法包括:获取待处理的开放域数据;将所述开放域数据输入训练好的实体关系抽取模型,获得所述开放域数据中的实体关系;其中,所述实体关系抽取模型采用有监督学习算法进行训练;所述训练好的实体关系抽取模型包括头实体预测模块、实体关系和尾实体联合预测模块;则,所述将所述开放域数据输入训练好的实体关系抽取模型,抽取所述开放域数据中的实体关系,具体包括:将所述开放域数据输入所述头实体预测模块获取第一预测标注序列、句子特征向量以及头实体表示向量;将所述句子特征向量与所述头实体表示向量拼接得到拼接向量;将所述拼接向量输入所述实体关系和尾实体联合预测模块获取第二预测标注序列、第三预测标注序列;将所述第一预测标注序列、所述第二预测标注序列以及所述第三预测标注序列依次连接获得所述开放域数据中的实体关系;所述实体关系抽取模型的具体训练过程如下:M1:通过采用空洞卷积神经网络DCNN1拼接attention1层,获得所述句子特征向量,再拼接softmax1分类器输出层,输出所述第一预测标注序列;M2:抽取出句子实体,对于每一个实体,将所述句子实体视为头实体,使用GRU对所述句子实体进行编码,获得所述实体表示向量;M3:将步骤M1的attention1层获得的句子特征向量和步骤M2获得的实体表示向量进行拼接,输入到新的空洞卷积神经网络DCNN2拼接attention2层中,并在所述实体关系和尾实体联合预测模块输出端设置softmax2分类器输出层以及softmax3分类器输出层,分别输出所述第二预测标注序列以及所述第三预测标注序列;M4:最小化所述实体关系抽取模型的总损失函数即可训练出能够进行实体关系抽取的实体关系抽取模型;M5:分别从所述第二预测标注序列以及所述第三预测标注序列中找到对应的实体关系以及尾实体,构成头实体,实体关系,尾实体的三元组作为所述实体关系抽取模型抽取出的三元组信息;其中,所述实体关系抽取模型的总损失函数为:loss=loss1+loss2+loss3,式中,loss1为交叉熵损失函数,表示所述头实体预测模块的损失函数;loss2表示所述实体关系和尾实体联合预测模块的实体关系损失函数;loss3表示所述实体关系和尾实体联合预测模块的尾实体损失函数;其中, 式中,N为句子长度;|C|为标注类别的数量,当所述标注类别包括B、I、O、E时,|C|=4,当所述标注类别包括B、O、E时,|C|=3;i为所述标注类别的编号,当标注类别B的编号为i=0时,表示第0类为标注类别B;yi为样本标签的one-hot表示,当样本属于第i类标注类别时,yi为1,否则为0;pi为所述softmax1分类器在所述第i类,即yi=1的标注类别的输出概率;pc为所述sofmax1分类器在yc=1的标注类别的输出概率。

全文数据:

权利要求:

百度查询: 广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司 一种面向开放域的实体关系抽取方法、装置及终端设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。