买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】文档级事件因果关系识别方法、系统、介质、设备及终端_中国人民解放军海军工程大学_202211151113.2 

申请/专利权人:中国人民解放军海军工程大学

申请日:2022-09-21

公开(公告)日:2024-04-02

公开(公告)号:CN115577678B

主分类号:G06F40/126

分类号:G06F40/126;G06F40/194;G06F40/279;G06F40/30;G06F16/36;G06N3/042;G06N3/0464;G06N3/048;G06N3/0499;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2023.06.16#著录事项变更;2023.01.24#实质审查的生效;2023.01.06#公开

摘要:本发明属于自然语言处理、因果关系识别技术领域,公开了一种文档级事件因果关系识别方法、系统、介质、设备及终端,从源数据中提取文档及文档对应的标注信息;将文档进行编码,获取每个单词的向量表示;依次对文档中的文本关系和事件提及关系进行图建模,并使用图神经网络和门控机制对图中所有节点的向量表示进行更新,获取每个事件提及的向量表示;针对每一个事件对,使用神经网络预测所述事件对是否存在因果关系;根据预测结果和标注信息,对整个模型进行训练;将待进行抽取的文档输入到模型中,获得待抽取文档中所包含的因果关系。本发明能够对文档进行图建模,充分考虑了句子之间的上下文关系,从而能够更好地识别跨句子的事件因果关系。

主权项:1.一种文档级事件因果关系识别方法,其特征在于,所述文档级事件因果关系识别方法包括:从源数据中提取文档及文档对应的标注信息;将文档进行编码,利用预训练语言模型BERT和长短期记忆网络LSTM获取每个单词的向量表示;依次对文档中的文本结构和事件提及关系进行图建模,使用图神经网络和门控机制对图中所有节点的向量表示进行更新,获取每个句子和每个事件提及的向量表示;针对每一个事件对,利用相似度选择K个句子作为上下文与事件对共同编码,通过多层感知机预测所述事件对是否存在因果关系;根据预测结果和标注信息计算模型的损失,通过误差逆向传播更新模型梯度,对整个模型进行训练;预测时将待进行抽取的文档输入到模型中,获得待抽取文档中所包含的因果关系;所述文档级事件因果关系识别方法包括以下步骤:步骤一,从源数据中提取出所有文档以及文档对应的标注信息,标注信息中含有文档中所有的事件及事件之间的因果关系;步骤二,将步骤一中获得的所述文档按照BERT的方式进行分词,并依次使用BERT和双向LSTM进行编码,获得每个单词的向量表示;步骤三,将文档中的句子和单词作为图节点构建异构图用于获取句子和单词的语义表示,并使用步骤二中获得的所述单词的向量表示初始化图节点的向量表示;使用图神经网络和门控机制进行图节点向量表示的更新;步骤四,将文档中的事件提及和句子作为图节点构建异构图,使用步骤三中获得的所述图节点的向量表示初始化图节点的向量表示;使用图神经网络和门控机制进行图节点向量表示的更新,获得事件提及和句子的向量表示;步骤五,使用步骤四中获得的所述事件提及和句子的向量表示,对于每一对事件,计算各个句子和相似度;取最相似的K个句子与这一对事件输入到神经网络中,预测这对事件是否有因果关系,根据预测结果与标注信息对整个模型进行训练,获得最终的事件因果关系识别模型;步骤六,给定待进行事件因果关系识别的文档,将所述文档输入到步骤五获得的事件因果关系识别模型中,得到所述文档所包含的事件因果关系。

全文数据:

权利要求:

百度查询: 中国人民解放军海军工程大学 文档级事件因果关系识别方法、系统、介质、设备及终端

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。