买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】命名实体识别模型训练方法及命名实体识别方法_阿里巴巴达摩院(杭州)科技有限公司_202210434208.9 

申请/专利权人:阿里巴巴达摩院(杭州)科技有限公司

申请日:2022-04-24

公开(公告)日:2022-09-23

公开(公告)号:CN114548109B

主分类号:G06F40/295

分类号:G06F40/295;G06F16/35;G06K9/62

优先权:

专利状态码:有效-授权

法律状态:2022.09.23#授权;2022.06.14#实质审查的生效;2022.05.27#公开

摘要:本说明书实施例提供命名实体识别模型训练方法及命名实体识别方法,其中所述命名实体识别模型训练方法包括:获取第一训练集、第二训练集和预训练的资源模型;利用第一训练集,对第二预设语言模型进行训练,得到目标模型;从第二训练集中提取任一第二资源词条,将该第二资源词条分别输入资源模型和目标模型,得到该第二资源词条的第一资源类别和第二资源类别;根据第一资源类别和第二资源类别调整目标模型的模型参数,返回执行从第二训练集中提取任一第二资源词条的步骤,在达到第一预设训练停止条件的情况下,确定训练后的目标模型作为命名实体识别模型。提高了命名实体识别模型的可靠性,提高基于命名实体识别模型进行命名实体识别的准确度。

主权项:1.一种命名实体识别模型训练方法,包括:获取第一训练集、第二训练集和预训练的资源模型,其中,所述第一训练集包括多个标注有资源类别的第一资源词条,第二训练集包括未标注的第二资源词条,所述资源模型基于多个标注有资源类别的第三资源词条对第一预设语言模型训练得到,针对所述第三资源词条标注的资源类别种类大于针对所述第一资源词条标注的资源类别种类;利用所述第一训练集,对第二预设语言模型进行训练,得到目标模型;从所述第二训练集中提取任一第二资源词条,将该第二资源词条分别输入所述资源模型和所述目标模型,得到该第二资源词条的第一资源类别和第二资源类别;根据所述第一资源类别和所述第二资源类别调整所述目标模型的模型参数,返回执行所述从所述第二训练集中提取任一第二资源词条的步骤,在达到第一预设训练停止条件的情况下,确定训练后的所述目标模型作为命名实体识别模型。

全文数据:

权利要求:

百度查询: 阿里巴巴达摩院(杭州)科技有限公司 命名实体识别模型训练方法及命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。