买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种用于级联地名实体识别模型的训练方法_中国科学院计算技术研究所;中国雄安集团有限公司_202110837354.1 

申请/专利权人:中国科学院计算技术研究所;中国雄安集团有限公司

申请日:2021-07-23

公开(公告)日:2024-03-08

公开(公告)号:CN113515947B

主分类号:G06F40/295

分类号:G06F40/295;G06F40/216;G06F18/214;G06N3/0464;G06N3/049;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.03.08#授权;2022.02.18#专利申请权的转移;2021.11.05#实质审查的生效;2021.10.19#公开

摘要:本发明提供一种用于级联地名实体识别模型的训练方法,所述级联地名实体识别模型是端到端模型,从输入到输出依次包括嵌入层、BiLSTM层、自注意力层以及CRF层,其中,所述嵌入层用于将语料样本的每个字映射为低维随机变量,所述自注意力层用于根据BiLSTM的输出计算级联地名文字的隐向量,所述方法包括:对级联地名语料数据进行预处理,获取训练样本;基于所述训练样本训练所述模型。

主权项:1.一种用于级联地名实体识别模型的训练方法,所述级联地名实体识别模型是端到端模型,从输入到输出依次包括嵌入层、BiLSTM层、自注意力层以及CRF层,其中,所述嵌入层用于将语料样本的每个字映射为低维随机变量,所述自注意力层用于根据BiLSTM的输出计算级联地名文字的隐向量,所述CRF层用于保证前后地名间的强约束关系,所述方法包括:对级联地名语料数据进行预处理,获取训练样本;基于所述训练样本训练所述模型,其中,所述自注意力层利用以下公式计算级联地名文字的隐向量, 其中,πi,j是级联地名中第i个文字与第j个上下文文字的注意力得分,hi表示BiLSTM层的第i个级联地名文字的输出向量,hj表示BiLSTM层的第j个级联地名文字的输出向量,π*i,j表示每个注意力得分的归一化权重,ei表示第i个地名文字输出对应的隐向量。

全文数据:

权利要求:

百度查询: 中国科学院计算技术研究所;中国雄安集团有限公司 一种用于级联地名实体识别模型的训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。