申请/专利权人:无锡学院
申请日:2024-01-30
公开(公告)日:2024-04-09
公开(公告)号:CN117852498A
主分类号:G06F40/126
分类号:G06F40/126;G06F40/30;G06F16/35;G06N3/042;G06N3/0464;G06N3/048;G06N3/08
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.26#实质审查的生效;2024.04.09#公开
摘要:本发明公开了一种基于关系原型和实体类型的关系提取方法,包括:构建约束图;构建关系抽取模型ERPET,关系抽取模型ERPET包括句子编码器、约束图编码器和关系分类器;将句子中的每个单词向量化,得到单词向量;采用PCNN网络构建句子袋中每个句子的向量表示;将每个单词相对于头实体和尾实体的相对位置进行向量化,得到位置向量;将句子表示和实体类型表示进行拼接,得到包含实体类型信息的第二句子表示;将上述步骤得到的表示输入两层全连接层和预设的softmax函数,得到各个类别的概率分布预测,最大概率对应的类别即为分类结果;通过本发明方法增强关系抽取模型ERPET对长尾关系实例的表征能力,提升提取长尾关系的能力。
主权项:1.一种基于关系原型和实体类型的关系提取方法,其特征在于,包括以下步骤:1统计训练集中的关系和实体类型对应关系,构建约束图;2构建关系抽取模型ERPET,关系抽取模型ERPET包括句子编码器、约束图编码器和关系分类器;向关系抽取模型ERPET中输入数据集,数据集中的每个实例包含句子、实体对和实体类型,设输入的句子为s={w1,w2,…,wn},头实体位置为p1,尾实体位置为p2,头实体类型为t1,尾实体类型为t2;3将句子中的每个单词向量化,得到单词向量;采用PCNN网络构建句子袋中每个句子的向量表示;4将每个单词相对于头实体和尾实体的相对位置进行向量化,得到位置向量;5将单词向量和位置向量进行拼接得到句子向量;6采用PCNN网络提取句子向量的特征,得到第一句子表示;7使用图卷积GCN神经网络模型对约束图进行编码,得到约束图Embedding;8根据约束图Embedding得到头尾实体类型的Embedding,并使用ReLU和tanh函数激活;9将步骤6的句子表示和步骤8的实体类型表示进行拼接,得到包含实体类型信息的第二句子表示;10将步骤9得到的表示输入两层全连接层和预设的softmax函数,得到各个类别的概率分布预测,最大概率对应的类别即为分类结果;11使用预设的总损失函数对预测值与真实值计算损失。
全文数据:
权利要求:
百度查询: 无锡学院 一种基于关系原型和实体类型的关系提取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。