买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于BiLSTM-CRF模型的实体识别方法及系统_深圳供电局有限公司_202410246801.X 

申请/专利权人:深圳供电局有限公司

申请日:2024-03-04

公开(公告)日:2024-05-10

公开(公告)号:CN118013973A

主分类号:G06F40/295

分类号:G06F40/295;G06F40/211;G06N3/0442;G06N3/084

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.28#实质审查的生效;2024.05.10#公开

摘要:本申请公开了一种基于BiLSTM‑CRF模型的实体识别方法及系统,包括:获取预设BiLSTM‑CRF模型;通过目标词向量模型对目标输入文本进行词向量转换,得到目标词向量;通过BiLSTM层对目标词向量进行特征提取,得到目标特征数据;将目标特征数据经过线性层映射,得到第一发射矩阵;确定目标输入文本对应的目标专业领域,及其对应的目标实体数据集;获取目标实体数据集对应的n个目标偏好等级;根据n个目标偏好等级对第一发射矩阵进行调节,得到第二发射矩阵;将第二发射矩阵输入CRF层,得到目标CRF层;对目标输入文本进行预测,得到目标预测结果;采用本申请实施例,实现了对NER模型识别偏好的调节。

主权项:1.一种基于BiLSTM-CRF模型的实体识别方法,其特征在于,所述方法包括:获取预设BiLSTM-CRF模型;所述预设BiLSTM-CRF模型包括:输入层、BiLSTM层、线性层、CRF层;所述输入层包括目标词向量模型;通过所述目标词向量模型对目标输入文本进行词向量转换,得到目标词向量;所述目标词向量包括至少一个词向量;通过所述BiLSTM层对所述目标词向量进行特征提取,得到目标特征数据;将所述目标特征数据经过所述线性层映射,得到第一发射矩阵;所述第一发射矩阵包括所述目标词向量中每一词向量对应的不同实体的发射概率;确定所述目标输入文本对应的专业领域,得到目标专业领域;确定所述目标输入文本在所述目标专业领域中可能包含的所有实体,得到目标实体数据集;获取所述目标实体数据集中每一实体对应的目标偏好等级,得到n个目标偏好等级;n为正整数;根据所述n个目标偏好等级对所述第一发射矩阵进行调节,得到第二发射矩阵;将所述第二发射矩阵输入所述CRF层以优化该层的模型参数,得到优化后的目标CRF层;将所述目标输入文本输入到所述目标CRF层进行预测,得到目标预测结果;所述目标预测结果包括所述目标输入文本中每一token的预测标签。

全文数据:

权利要求:

百度查询: 深圳供电局有限公司 基于BiLSTM-CRF模型的实体识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。