申请/专利权人:中国电子科技集团公司第十研究所
申请日:2022-10-31
公开(公告)日:2022-12-30
公开(公告)号:CN115544212A
主分类号:G06F16/33
分类号:G06F16/33;G06F16/35;G06F40/126;G06F40/279;G06F40/30
优先权:
专利状态码:在审-实质审查的生效
法律状态:2023.01.20#实质审查的生效;2022.12.30#公开
摘要:本发明公开了一种文档级事件要素抽取方法、设备及介质,属于文档级事件要素抽取领域,包括如下步骤:获取句子向量,将各个句子向量进行拼接,获得初始篇章向量,同时将句子向量送入注意力机制网络,获取包含句子间隐含关系的篇章向量,并将二者向量进行混合表征,得到最终的文本篇章表示;进行事件句识别及要素抽取、中心句识别及事件要素以及跨句事件关系抽取;对中心句和事件间的相关关系进行数理统计,基于竞争性原则完成中心句筛选;基于要素补全模型,完成中心事件要素补全,得到完整的文档级事件要素。本发明具有完备性和实用型的优点。
主权项:1.一种文档级事件要素抽取方法,其特征在于,包括以下步骤:S1,将篇章文本进行分句得到句子片段,对句子片段进行字符编码、位置编码和类型编码,分别得到编码向量C、L、S;将编码向量C、L、S进行叠加得到句子级初始化向量后送入预训练模型,获取句子向量Vi,所述预训练模型包括Bert预训练模型;将各个句子向量Vi进行拼接,获得初始篇章向量Vinitial;同时将句子级初始化向量送入注意力机制网络,对不同的句子赋予不同的权重值,获取包含句子间隐含关系的篇章向量Vrelation;将Vinitial和Vrelation进行叠加混合表征,得到最终的文本篇章表示Vtext;S2,基于步骤S1的文本篇章表示Vtext,通过序列标注方式对句子向量进行分类完成事件句识别及要素抽取,对篇章向量进行分类完成中心句识别及要素抽取,同时获得事件相关关系;S3,对中心句和事件间的相关关系进行数理统计,基于竞争性原则完成中心句筛选;S4,基于要素补全模型,完成中心事件要素补全,得到完整的文档级事件要素。
全文数据:
权利要求:
百度查询: 中国电子科技集团公司第十研究所 文档级事件要素抽取方法、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。