买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种融合局部上下文信息并利用标签语义进行命名实体识别的方法_重庆邮电大学_202311826871.4 

申请/专利权人:重庆邮电大学

申请日:2023-12-28

公开(公告)日:2024-04-09

公开(公告)号:CN117852540A

主分类号:G06F40/295

分类号:G06F40/295;G06F40/284;G06F40/30;G06N3/0455;G06N3/0442;G06N3/0464;G06N3/084;G06N3/0985

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明涉及一种融合局部上下文信息并利用标签语义进行命名实体识别的方法。该方法包括以下步骤:对数据进行预处理,得到标签的自然语言形式;使用两个基于Transformer的模型提取全局上下文信息向量和标签语义向量。然后通过多窗口Bi_LSTM层增强局部上下文信息提取,同时,利用基于CNN的联合学习模块进一步捕捉相邻词之间的局部上下文信息。通过多窗口注意力层整合全局上下文和局部上下文信息,以获得token的最终表示,最后计算token与每个标签的相似度,选取与token相似度最高的标签作为该token的预测值。本发明弥补了基于Transformer的模型对局部上下文信息提取不充分的缺陷。此外,本发明还使用标签语义进行预测,提高了任务预测的准确率。

主权项:1.一种融合局部上下文信息并利用标签语义进行命名实体识别的方法,其特征在于,包括以下步骤:对数据进行预处理,并得到数据中所有标签的自然语言形式;将预处理后的数据以及自然语言形式的标签集分别输入到两个基于Transformer的模型中,以获得蕴含全局上下文信息的向量和蕴含标签语义信息的向量;将蕴含全局上下文信息的向量输入到多窗口的Bi_LSTM层,以获得多层次的蕴含局部上下文信息的向量;并将蕴含全局上下文信息的向量输入到基于CNN的联合学习模块,增强模型对相邻词之间局部上下文信息的捕捉能力;然后将之前得到的蕴含全局上下文信息的向量和多层次的蕴含局部上下文信息的向量一起输入到多窗口注意力层进行信息融合,以获得token的最终表示,然后取蕴含标签语义信息的向量中[CLS]对应的词嵌入作为标签的最终表示;将token的最终表示与每个标签的最终表示进行点乘,以计算token与每个标签之间的相似度;最后,利用softmax和argmax来选取与token相似度最高的标签作为该token的预测值。训练命名实体识别模型的过程包括:S1:数据预处理,遍历训练集和验证集,获取所有标签。S2:将经过预处理的数据和自然语言形式的标签集分别输入两个基于Transformer的模型,以获得蕴含全局上下文信息的向量和蕴含标签语义信息的向量。S3:将蕴含全局上下文信息的向量输入多窗口的Bi_LSTM层,以获得多层次的蕴含局部上下文信息的向量。并将蕴含全局上下文信息的向量输入到基于CNN的联合学习模块,增强模型对相邻词之间局部上下文信息的捕捉能力。S4:将之前获得的蕴含全局上下文信息的向量和多层次的蕴含局部上下文信息的向量一起输入到多窗口的注意力层,进行信息融合,得到token的最终表示。S5:从蕴含标签语义信息的向量中选择[CLS]对应的词嵌入作为标签的最终表示。S6:将token的最终表示与每个标签的最终表示进行点乘,计算token与每个标签之间的相似度。然后使用softmax和argmax选择与token相似度最高的标签作为该token的预测值。S7:设置迭代次数的初始值。S8:使用交叉熵损失函数训练模型。S9:使用Adam算法来优化模型,即在训练过程中调整基于Transformer的模型、Bi_LSTM和基于CNN的联合学习模块的参数。S10:检查迭代次数是否达到最大迭代次数。如果达到,完成命名实体识别模型的训练;否则,返回到步骤S8,增加迭代次数。

全文数据:

权利要求:

百度查询: 重庆邮电大学 一种融合局部上下文信息并利用标签语义进行命名实体识别的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。