买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】文档级事件要素抽取方法、设备及介质_中国电子科技集团公司第十研究所_202211344142.0 

申请/专利权人:中国电子科技集团公司第十研究所

申请日:2022-10-31

公开(公告)日:2022-12-30

公开(公告)号:CN115544212A

主分类号:G06F16/33

分类号:G06F16/33;G06F16/35;G06F40/126;G06F40/279;G06F40/30

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.01.20#实质审查的生效;2022.12.30#公开

摘要:本发明公开了一种文档级事件要素抽取方法、设备及介质,属于文档级事件要素抽取领域,包括如下步骤:获取句子向量,将各个句子向量进行拼接,获得初始篇章向量,同时将句子向量送入注意力机制网络,获取包含句子间隐含关系的篇章向量,并将二者向量进行混合表征,得到最终的文本篇章表示;进行事件句识别及要素抽取、中心句识别及事件要素以及跨句事件关系抽取;对中心句和事件间的相关关系进行数理统计,基于竞争性原则完成中心句筛选;基于要素补全模型,完成中心事件要素补全,得到完整的文档级事件要素。本发明具有完备性和实用型的优点。

主权项:1.一种文档级事件要素抽取方法,其特征在于,包括以下步骤:S1,将篇章文本进行分句得到句子片段,对句子片段进行字符编码、位置编码和类型编码,分别得到编码向量C、L、S;将编码向量C、L、S进行叠加得到句子级初始化向量后送入预训练模型,获取句子向量Vi,所述预训练模型包括Bert预训练模型;将各个句子向量Vi进行拼接,获得初始篇章向量Vinitial;同时将句子级初始化向量送入注意力机制网络,对不同的句子赋予不同的权重值,获取包含句子间隐含关系的篇章向量Vrelation;将Vinitial和Vrelation进行叠加混合表征,得到最终的文本篇章表示Vtext;S2,基于步骤S1的文本篇章表示Vtext,通过序列标注方式对句子向量进行分类完成事件句识别及要素抽取,对篇章向量进行分类完成中心句识别及要素抽取,同时获得事件相关关系;S3,对中心句和事件间的相关关系进行数理统计,基于竞争性原则完成中心句筛选;S4,基于要素补全模型,完成中心事件要素补全,得到完整的文档级事件要素。

全文数据:

权利要求:

百度查询: 中国电子科技集团公司第十研究所 文档级事件要素抽取方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。