【发明授权】一种用于级联地名实体识别模型的训练方法_中国科学院计算技术研究所;中国雄安集团有限公司_202110837354.1

申请/专利权人：中国科学院计算技术研究所;中国雄安集团有限公司

申请日：2021-07-23

公开（公告）日：2024-03-08

公开（公告）号：CN113515947B

主分类号：G06F40/295

分类号：G06F40/295;G06F40/216;G06F18/214;G06N3/0464;G06N3/049;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.03.08#授权;2022.02.18#专利申请权的转移;2021.11.05#实质审查的生效;2021.10.19#公开

摘要：本发明提供一种用于级联地名实体识别模型的训练方法，所述级联地名实体识别模型是端到端模型，从输入到输出依次包括嵌入层、BiLSTM层、自注意力层以及CRF层，其中，所述嵌入层用于将语料样本的每个字映射为低维随机变量，所述自注意力层用于根据BiLSTM的输出计算级联地名文字的隐向量，所述方法包括：对级联地名语料数据进行预处理，获取训练样本；基于所述训练样本训练所述模型。

主权项：1.一种用于级联地名实体识别模型的训练方法，所述级联地名实体识别模型是端到端模型，从输入到输出依次包括嵌入层、BiLSTM层、自注意力层以及CRF层，其中，所述嵌入层用于将语料样本的每个字映射为低维随机变量，所述自注意力层用于根据BiLSTM的输出计算级联地名文字的隐向量，所述CRF层用于保证前后地名间的强约束关系，所述方法包括：对级联地名语料数据进行预处理，获取训练样本；基于所述训练样本训练所述模型，其中，所述自注意力层利用以下公式计算级联地名文字的隐向量，其中，πi,j是级联地名中第i个文字与第j个上下文文字的注意力得分，hi表示BiLSTM层的第i个级联地名文字的输出向量，hj表示BiLSTM层的第j个级联地名文字的输出向量，π*i,j表示每个注意力得分的归一化权重，ei表示第i个地名文字输出对应的隐向量。

全文数据：

权利要求：

百度查询：中国科学院计算技术研究所;中国雄安集团有限公司一种用于级联地名实体识别模型的训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种水泥砼搅拌机用振动下料装置_巢湖市恒峰建设工程有限公司_202322581391.8

下一篇：双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

相关技术

一种水泥砼搅拌机用振动下料装置_巢湖市恒峰建设工程有限公司_202322581391.8

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种液压锁密闭性测试装置_靖江市长源液压机械有限公司_202322518953.4

一种具有服药求助警报功能的药丸储存项链_杨洁_202322091839.8

一种注塑机新型泵罩门板_恩格尔注塑机械(常州)有限公司_202322227242.1

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

一种高效散热电源_广州市力为电子有限公司_202322175013.X

龙图腾网&IPTOP

【发明授权】一种用于级联地名实体识别模型的训练方法_中国科学院计算技术研究所;中国雄安集团有限公司_202110837354.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务