【发明公布】一种融合局部上下文信息并利用标签语义进行命名实体识别的方法_重庆邮电大学_202311826871.4

申请/专利权人：重庆邮电大学

申请日：2023-12-28

公开（公告）日：2024-04-09

公开（公告）号：CN117852540A

主分类号：G06F40/295

分类号：G06F40/295;G06F40/284;G06F40/30;G06N3/0455;G06N3/0442;G06N3/0464;G06N3/084;G06N3/0985

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.26#实质审查的生效;2024.04.09#公开

摘要：本发明涉及一种融合局部上下文信息并利用标签语义进行命名实体识别的方法。该方法包括以下步骤:对数据进行预处理，得到标签的自然语言形式；使用两个基于Transformer的模型提取全局上下文信息向量和标签语义向量。然后通过多窗口Bi_LSTM层增强局部上下文信息提取，同时，利用基于CNN的联合学习模块进一步捕捉相邻词之间的局部上下文信息。通过多窗口注意力层整合全局上下文和局部上下文信息，以获得token的最终表示，最后计算token与每个标签的相似度，选取与token相似度最高的标签作为该token的预测值。本发明弥补了基于Transformer的模型对局部上下文信息提取不充分的缺陷。此外，本发明还使用标签语义进行预测，提高了任务预测的准确率。

主权项：1.一种融合局部上下文信息并利用标签语义进行命名实体识别的方法，其特征在于，包括以下步骤:对数据进行预处理，并得到数据中所有标签的自然语言形式；将预处理后的数据以及自然语言形式的标签集分别输入到两个基于Transformer的模型中，以获得蕴含全局上下文信息的向量和蕴含标签语义信息的向量；将蕴含全局上下文信息的向量输入到多窗口的Bi_LSTM层，以获得多层次的蕴含局部上下文信息的向量；并将蕴含全局上下文信息的向量输入到基于CNN的联合学习模块，增强模型对相邻词之间局部上下文信息的捕捉能力；然后将之前得到的蕴含全局上下文信息的向量和多层次的蕴含局部上下文信息的向量一起输入到多窗口注意力层进行信息融合，以获得token的最终表示，然后取蕴含标签语义信息的向量中[CLS]对应的词嵌入作为标签的最终表示；将token的最终表示与每个标签的最终表示进行点乘，以计算token与每个标签之间的相似度；最后，利用softmax和argmax来选取与token相似度最高的标签作为该token的预测值。训练命名实体识别模型的过程包括:S1:数据预处理，遍历训练集和验证集，获取所有标签。S2:将经过预处理的数据和自然语言形式的标签集分别输入两个基于Transformer的模型，以获得蕴含全局上下文信息的向量和蕴含标签语义信息的向量。S3:将蕴含全局上下文信息的向量输入多窗口的Bi_LSTM层，以获得多层次的蕴含局部上下文信息的向量。并将蕴含全局上下文信息的向量输入到基于CNN的联合学习模块，增强模型对相邻词之间局部上下文信息的捕捉能力。S4:将之前获得的蕴含全局上下文信息的向量和多层次的蕴含局部上下文信息的向量一起输入到多窗口的注意力层，进行信息融合，得到token的最终表示。S5:从蕴含标签语义信息的向量中选择[CLS]对应的词嵌入作为标签的最终表示。S6:将token的最终表示与每个标签的最终表示进行点乘，计算token与每个标签之间的相似度。然后使用softmax和argmax选择与token相似度最高的标签作为该token的预测值。S7:设置迭代次数的初始值。S8:使用交叉熵损失函数训练模型。S9:使用Adam算法来优化模型，即在训练过程中调整基于Transformer的模型、Bi_LSTM和基于CNN的联合学习模块的参数。S10:检查迭代次数是否达到最大迭代次数。如果达到，完成命名实体识别模型的训练；否则，返回到步骤S8，增加迭代次数。

全文数据：

权利要求：

百度查询：重庆邮电大学一种融合局部上下文信息并利用标签语义进行命名实体识别的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

下一篇：一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

相关技术

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

进行相关技术

用于对工件进行激光加工的加工设备、用于对工件进行激光加工的方法_百超激光有限公司_202080064937.9

一种纤维表面进行保护处理的装置_江苏鹰游纺机有限公司_202321177071.X

动态使用生理传感器响应进行情绪状态评估_通用汽车环球科技运作有限责任公司_202310506397.0

模拟风荷载作用下对混凝土进行性能测试的试验装置_中国铁道科学研究院集团有限公司铁道建筑研究所_202322293319.5

一种对铝制品进行研磨抛光的加工装置_南通新冠精密配件有限公司_202322153752.9

一种NFC标签基于侦测线状态进行生命周期管理的方法_芯电智联(北京)科技有限公司_202310897116.9

一种方便进行收线的机器人扩展坞_东莞市乐晟通电子科技有限公司_202321395641.2

使用混叠来进行信号的节能传输和接收的方法和设备_瑞典爱立信有限公司_201880094820.8

以扰乱时序的模式进行的软件向后兼容性测试_索尼互动娱乐有限责任公司_202010187251.0

无线通信中使用载波聚合进行功率控制的方法和装置_高通股份有限公司_202110356077.2

利用相关技术

余热利用预热炉_赤峰丰荣金刚砂有限责任公司_202322604530.4

利用沉井后作隧道风井结构_中国联合工程有限公司_202322227647.5

冷量梯级利用的空调装置_新疆绿色使者空气环境技术有限公司_201811006332.5

应用于电池梯次利用的装置_珠海中力新能源科技有限公司_201910467653.3

一种染整废水回收利用装置_绍兴金祥惠纺织印染有限公司_202322290876.1

化合物及利用其的有机发光器件_株式会社LG化学_202080006647.9

化合物及利用其的有机发光器件_株式会社LG化学_202080006730.6

一种煤化工固体炉渣再利用装置_内蒙古自治区产品质量检验研究院_202322457081.5

一种热镀锌带钢生产余热利用装置_唐山锡丰实业有限公司_202322660020.9

冷量自利用半导体致冷除湿机_香河汇文节能科技有限公司_202322666428.7

标签相关技术

一种塑料标签_南通星焰智能科技有限公司_202322574742.2

标签识别网络的训练方法、标签识别装置/方法及设备_京东方科技集团股份有限公司_201811353105.X

一种手写标签纸_张必余_202322626909.5

一种表面不平整标签_浙江酷勒包装材料有限公司_202322612648.1

一种标签印刷智能配墨装置_广州广彩标签有限公司_202322515675.7

识别标签的方法、装置、设备以及介质_北京有竹居网络技术有限公司_202011086888.7

一种电子标签的封装结构_苏州鑫福耀智能科技有限公司_202322712016.2

一种基于动态标签的NFC充电装置_浙江先芯科技有限公司_202321917628.9

一种便于清洁的电子标签_苏州鑫福耀智能科技有限公司_202322479066.0

具有3球式离合器和旋转驱动脱扣器的安全标签_先讯美资电子有限责任公司_202080053308.6

龙图腾网&IPTOP

【发明公布】一种融合局部上下文信息并利用标签语义进行命名实体识别的方法_重庆邮电大学_202311826871.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务