申请/专利权人:鹏城实验室
申请日:2023-02-20
公开(公告)日:2023-05-26
公开(公告)号:CN116167359A
主分类号:G06F40/211
分类号:G06F40/211;G06F40/289;G06F40/268;G06F18/22;G06N3/0442
优先权:
专利状态码:在审-实质审查的生效
法律状态:2023.06.13#实质审查的生效;2023.05.26#公开
摘要:本发明公开了一种中心事件的提取方法、设备及介质,包括以下步骤:通过确定待提取文本中所包括的各单句分别与待提取文本的标题的相似度、各单句中所包括的触发词的第一权重,以及各单句中所包括的网络安全实体的第二权重后,根据各单句的相似度、第一权重和第二权重确定中心句,确定中心句中所包含的触发词,基于触发词确定中心句指向的事件类型,通过BiLSTM模型和CRF模型对中心句和事件类型进行计算,得到中心事件,通过三个维度来确定中心句,缩小了抽取范围,降低了次要事件对中心句的抽取的干扰,通过BiLSTM模型和CRF模型降低了流水线提取中心事件的方式存在的误差,以此提升了中心事件提取任务的便捷性和有效性。
主权项:1.一种中心事件的提取方法,其特征在于,所述中心事件的提取方法包括以下步骤:确定待提取文本中所包括的各单句分别与所述待提取文本的标题的相似度、各所述单句中所包括的触发词的第一权重,以及各所述单句中所包括的网络安全实体的第二权重后,根据各所述单句的所述相似度、所述第一权重和所述第二权重确定中心句;确定所述中心句中所包含的所述触发词,基于所述触发词确定所述中心句指向的事件类型;通过BiLSTM模型和CRF模型对所述中心句和所述事件类型进行计算,得到中心事件。
全文数据:
权利要求:
百度查询: 鹏城实验室 中心事件的提取方法、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。