买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】文本纠错模型训练、文本纠错方法及相关装置_北京世纪好未来教育科技有限公司_202011342345.7 

申请/专利权人:北京世纪好未来教育科技有限公司

申请日:2020-11-26

公开(公告)日:2021-04-06

公开(公告)号:CN112395864B

主分类号:G06F40/232(20200101)

分类号:G06F40/232(20200101);G06F40/284(20200101);G06N3/04(20060101);G06N3/08(20060101);G06K9/62(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.04.06#授权;2021.03.12#实质审查的生效;2021.02.23#公开

摘要:本发明实施例提供了一种文本纠错模型训练、文本纠错方法及相关装置,文本纠错模型训练方法包括:利用文本纠错模型获取噪声文本;获取噪声单词的噪声单词特征,噪声单词特征包括噪声单词字母依赖信息以及噪声文本的单词依赖信息;根据噪声单词特征获取各个训练可能预测单词及其训练单词预测概率,根据各个训练单词预测概率和与噪声单词对应的准确单词的单词准确概率,获取对应的单词相似度;根据各个单词相似度获取文本相似度,根据文本相似度对文本纠错模型的参数进行调整,直至所得到的文本相似度满足相似度阈值,结束文本纠错模型的训练。本发明实施例所提供的文本纠错模型训练、文本纠错方法及相关装置,可以对文本的纠错效果。

主权项:1.一种文本纠错模型训练方法,其特征在于,包括:利用文本纠错模型获取噪声文本,所述噪声文本包括噪声单词;对各个所述噪声单词执行以下操作:获取所述噪声单词的噪声单词特征,其中,所述噪声单词特征包括所述噪声单词的各个噪声字母的字母依赖信息,以及所述噪声文本的各个噪声单词的单词依赖信息;根据所述噪声单词特征获取各个训练可能预测单词和各个训练可能预测单词的训练单词预测概率,根据各个所述训练单词预测概率和与所述噪声单词对应的准确单词的单词准确概率,获取对应的单词相似度;当获取所述噪声文本的各个所述单词相似度时,根据各个所述单词相似度获取文本相似度,根据所述文本相似度对所述文本纠错模型的参数进行调整,直至所得到的文本相似度满足相似度阈值,结束所述文本纠错模型的训练。

全文数据:

权利要求:

百度查询: 北京世纪好未来教育科技有限公司 文本纠错模型训练、文本纠错方法及相关装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。