首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种融合论据和结构信息的事件因果关系识别方法_华东师范大学_202410071040.9 

申请/专利权人:华东师范大学

申请日:2024-01-18

公开(公告)日:2024-05-07

公开(公告)号:CN117993508A

主分类号:G06N5/04

分类号:G06N5/04;G06N5/045;G06N3/0455;G06N3/0475;G06N3/096

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.24#实质审查的生效;2024.05.07#公开

摘要:本发明公开了一种融合论据和结构信息的事件因果关系识别方法,其特点是采用多任务学习框架,通过基本论据和结构信息感知的因果问题回答来增强事件因果关系识别;将文档级事件因果关系识别转化为多项选择题生成式问答,并融合论据和结构信息,使用大型语言模型生成被质疑事件的因果关系,该方法具体包括:数据准备、论据生成、结构信息和模型训练等步骤。本发明与现有技术相比具有识别精确性和效率高的优点,为文档级事件因果关系识别领域带来了新的前沿和突破,方法简便,使用效果好,同时适应有限的计算成本和可接受的时间,具有良好的运用前景和商业价值。

主权项:1.一种融合论据和结构信息的事件因果关系识别方法,其特征在于,采用多任务学习框架,将融合智能模型生成的论据和构建的结构信息到多选题QA,通过基本论据和结构信息感知的因果问题回答来增强事件因果关系识别,具体包括下述步骤:(一)数据的准备1-1:将事件对之间的因果识别转换为多项选择题,对于每一个事件作为为观察到的事件,询问列出的选项中的哪一个是其因果关系;1-2:对问题文本进行裁切,仅保留观察到的事件和候选事件的开头和结尾部分,以减少文本中的噪音,排除不相关事件的影响;1-3:对训练集和测试集进行题目选项构建,即构建符合题目的候选事件集合作为多选题选项,所述训练集将所有具有因果关系的事件被纳入选项,若存在共指事件,则选取与观察事件最接近的,同时添加至少三个无关的事件作为干扰项;所述测试集将每个事件作为观察到的事件依次迭代,每个事件集都作为选项提及;所述训练集和测试集源于开源数据集,并经训练集与测试集按8:2比例分割得到的;1-4:将上述构建的训练集用于训练多选题QA模型,测试集用于评估多选题QA模型在因果关系识别上的性能表现,所述多选题QA模型为基于开源的Baichuan2-7B-Chat生成模型,其输入是问题,输出是选项标签;(二)论据的生成将融合智能模型生成的论据注入上述构建的多选题QA模型,作为模型训练时预测答案的监督工具;(三)结构信息的构建根据事件的位置对其进行排序,以自然的语言方式结合事件共指和因果关系,采用因果图结构线性化方法,得到自然语句描述的事件因果图结构;(四)模型的训练和优化对融合智能模型生成的论据和构建的结构信息注入多选题QA模型中进行多任务训练,对训练后的多选题QA模型进行微调,同一生成的模型同时学习三个任务,并进行训练以最小化损失,最终得到的多选题QA模型用于事件因果关系的识别。

全文数据:

权利要求:

百度查询: 华东师范大学 一种融合论据和结构信息的事件因果关系识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。