买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】词汇识别模型的训练方法、词汇识别方法、装置及设备_北京声智科技有限公司_202311774824.X 

申请/专利权人:北京声智科技有限公司

申请日:2023-12-21

公开(公告)日:2024-03-01

公开(公告)号:CN117633537A

主分类号:G06F18/214

分类号:G06F18/214;G06F40/279;G06F40/30;G06F40/194

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.19#实质审查的生效;2024.03.01#公开

摘要:本申请公开了词汇识别模型的训练方法、词汇识别方法、装置及设备,属于机器学习技术领域。训练方法包括:获取第一文本流;对于第一文本流包括的多个文本中的任一个文本,调用初始识别模型获取该文本的上下文,基于上下文确定初始识别模型的敏感词判定阈值,基于敏感词判定阈值对该文本进行识别,输出识别到的第一敏感词;基于多个文本中的第一敏感词,更新初始识别模型,得到词汇识别模型,词汇识别模型用于识别第二文本流包括的文本中的敏感词。该方法中,确定的敏感词判定阈值与文本所处的实际语境的适配程度较高,从而基于确定的敏感词判定阈值对敏感词进行识别的准确性较高,调用得到的词汇识别模型对文本中的敏感词进行识别的准确性较高。

主权项:1.一种词汇识别模型的训练方法,其特征在于,所述方法包括:获取第一文本流,所述第一文本流包括多个文本;对于所述多个文本中的任一个文本,调用初始识别模型获取所述任一个文本的上下文,基于所述任一个文本的上下文确定所述初始识别模型的敏感词判定阈值,基于所述敏感词判定阈值对所述任一个文本进行识别,输出识别到的所述任一个文本中的第一敏感词;基于识别到的所述多个文本中的第一敏感词,更新所述初始识别模型,得到词汇识别模型,所述词汇识别模型用于识别第二文本流包括的文本中的敏感词。

全文数据:

权利要求:

百度查询: 北京声智科技有限公司 词汇识别模型的训练方法、词汇识别方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。