买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种命名实体识别方法、装置及终端设备_中国移动通信有限公司研究院;中国移动通信集团有限公司_201910000943.7 

申请/专利权人:中国移动通信有限公司研究院;中国移动通信集团有限公司

申请日:2019-01-02

公开(公告)日:2024-04-19

公开(公告)号:CN111401064B

主分类号:G06F40/295

分类号:G06F40/295

优先权:

专利状态码:有效-授权

法律状态:2024.04.19#授权;2020.08.04#实质审查的生效;2020.07.10#公开

摘要:本发明提供一种命名实体识别方法、装置及终端设备,该命名实体识别方法包括:获取待识别数据;对所述待识别数据进行预处理,获得待识别数据的字符向量;将所述字符向量输入至预先训练的基于字的命名实体识别模型中,输出表示待识别数据的命名实体信息的识别结果;根据识别结果,确定所述待识别数据的命名实体;所述命名实体识别模型的训练特征向量包括训练数据的实体边界特征向量,用于提取训练数据的特征时,将同一命名实体的多个字符特征归一为相应命名实体的特征,以基于归一后的命名实体的特征进行模型参数训练。本发明的实施例,可以解决现有基于字的命名实体识别模型存在的实体边界问题,从而提高模型性能,提高命名实体识别时的准确率。

主权项:1.一种命名实体识别方法,其特征在于,包括:获取待识别数据;对所述待识别数据进行预处理,获得所述待识别数据的字符向量;将所述字符向量输入至预先训练的基于字的命名实体识别模型中,输出表示所述待识别数据的命名实体信息的识别结果;根据所述识别结果,确定所述待识别数据的命名实体;其中,所述命名实体识别模型的训练特征向量包括训练数据的实体边界特征向量,用于提取训练数据的特征时,将同一命名实体的多个字符特征归一为相应命名实体的特征,以基于归一后的命名实体的特征进行模型参数训练;其中,所述根据所述识别结果,确定所述待识别数据的命名实体,包括:根据所述识别结果,对所述待识别数据的字符级数据进行命名实体的标记,得到所述待识别数据的命名实体标签信息;当所述字符级数据中预设字符的平行位置上,一个位置存在命名实体标签信息,另一个位置不存在命名实体标签信息时,利用所述一个位置上存在的命名实体标签信息,对所述另一个位置进行标记,以更新所述待识别数据的命名实体标签信息;根据更新后的所述待识别数据的命名实体标签信息,确定所述待识别数据的命名实体。

全文数据:

权利要求:

百度查询: 中国移动通信有限公司研究院;中国移动通信集团有限公司 一种命名实体识别方法、装置及终端设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。