【发明公布】文档级事件要素抽取方法、设备及介质_中国电子科技集团公司第十研究所_202211344142.0

申请/专利权人：中国电子科技集团公司第十研究所

申请日：2022-10-31

公开（公告）日：2022-12-30

公开（公告）号：CN115544212A

主分类号：G06F16/33

分类号：G06F16/33;G06F16/35;G06F40/126;G06F40/279;G06F40/30

优先权：

专利状态码：在审-实质审查的生效

法律状态：2023.01.20#实质审查的生效;2022.12.30#公开

摘要：本发明公开了一种文档级事件要素抽取方法、设备及介质，属于文档级事件要素抽取领域，包括如下步骤：获取句子向量，将各个句子向量进行拼接，获得初始篇章向量，同时将句子向量送入注意力机制网络，获取包含句子间隐含关系的篇章向量，并将二者向量进行混合表征，得到最终的文本篇章表示；进行事件句识别及要素抽取、中心句识别及事件要素以及跨句事件关系抽取；对中心句和事件间的相关关系进行数理统计，基于竞争性原则完成中心句筛选；基于要素补全模型，完成中心事件要素补全，得到完整的文档级事件要素。本发明具有完备性和实用型的优点。

主权项：1.一种文档级事件要素抽取方法，其特征在于，包括以下步骤：S1，将篇章文本进行分句得到句子片段，对句子片段进行字符编码、位置编码和类型编码，分别得到编码向量C、L、S；将编码向量C、L、S进行叠加得到句子级初始化向量后送入预训练模型，获取句子向量Vi，所述预训练模型包括Bert预训练模型；将各个句子向量Vi进行拼接，获得初始篇章向量Vinitial；同时将句子级初始化向量送入注意力机制网络，对不同的句子赋予不同的权重值，获取包含句子间隐含关系的篇章向量Vrelation；将Vinitial和Vrelation进行叠加混合表征，得到最终的文本篇章表示Vtext；S2，基于步骤S1的文本篇章表示Vtext，通过序列标注方式对句子向量进行分类完成事件句识别及要素抽取，对篇章向量进行分类完成中心句识别及要素抽取，同时获得事件相关关系；S3，对中心句和事件间的相关关系进行数理统计，基于竞争性原则完成中心句筛选；S4，基于要素补全模型，完成中心事件要素补全，得到完整的文档级事件要素。

全文数据：

权利要求：

百度查询：中国电子科技集团公司第十研究所文档级事件要素抽取方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种装饰线条切割装置_安徽哲诚建筑工程有限公司_202322634078.6

下一篇：一种压延胶片自动巡边定点测厚仪_钛玛科(江苏)工业科技有限公司_202322668402.6

相关技术

一种装饰线条切割装置_安徽哲诚建筑工程有限公司_202322634078.6

一种压延胶片自动巡边定点测厚仪_钛玛科(江苏)工业科技有限公司_202322668402.6

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

一种园林绿化便携铲_马丽丽_202322375183.2

米粉生产用原料混合设备_郑州朱屯米粉食品有限公司_202322656894.7

一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种气辅实验用控制台_郑州金泰制罐有限公司_202322646692.4

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

龙图腾网&IPTOP

【发明公布】文档级事件要素抽取方法、设备及介质_中国电子科技集团公司第十研究所_202211344142.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务