买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于关系原型和实体类型的关系提取方法_无锡学院_202410132311.7 

申请/专利权人:无锡学院

申请日:2024-01-30

公开(公告)日:2024-04-09

公开(公告)号:CN117852498A

主分类号:G06F40/126

分类号:G06F40/126;G06F40/30;G06F16/35;G06N3/042;G06N3/0464;G06N3/048;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明公开了一种基于关系原型和实体类型的关系提取方法,包括:构建约束图;构建关系抽取模型ERPET,关系抽取模型ERPET包括句子编码器、约束图编码器和关系分类器;将句子中的每个单词向量化,得到单词向量;采用PCNN网络构建句子袋中每个句子的向量表示;将每个单词相对于头实体和尾实体的相对位置进行向量化,得到位置向量;将句子表示和实体类型表示进行拼接,得到包含实体类型信息的第二句子表示;将上述步骤得到的表示输入两层全连接层和预设的softmax函数,得到各个类别的概率分布预测,最大概率对应的类别即为分类结果;通过本发明方法增强关系抽取模型ERPET对长尾关系实例的表征能力,提升提取长尾关系的能力。

主权项:1.一种基于关系原型和实体类型的关系提取方法,其特征在于,包括以下步骤:1统计训练集中的关系和实体类型对应关系,构建约束图;2构建关系抽取模型ERPET,关系抽取模型ERPET包括句子编码器、约束图编码器和关系分类器;向关系抽取模型ERPET中输入数据集,数据集中的每个实例包含句子、实体对和实体类型,设输入的句子为s={w1,w2,…,wn},头实体位置为p1,尾实体位置为p2,头实体类型为t1,尾实体类型为t2;3将句子中的每个单词向量化,得到单词向量;采用PCNN网络构建句子袋中每个句子的向量表示;4将每个单词相对于头实体和尾实体的相对位置进行向量化,得到位置向量;5将单词向量和位置向量进行拼接得到句子向量;6采用PCNN网络提取句子向量的特征,得到第一句子表示;7使用图卷积GCN神经网络模型对约束图进行编码,得到约束图Embedding;8根据约束图Embedding得到头尾实体类型的Embedding,并使用ReLU和tanh函数激活;9将步骤6的句子表示和步骤8的实体类型表示进行拼接,得到包含实体类型信息的第二句子表示;10将步骤9得到的表示输入两层全连接层和预设的softmax函数,得到各个类别的概率分布预测,最大概率对应的类别即为分类结果;11使用预设的总损失函数对预测值与真实值计算损失。

全文数据:

权利要求:

百度查询: 无锡学院 一种基于关系原型和实体类型的关系提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术