【发明授权】文本纠错模型训练、文本纠错方法及相关装置_北京世纪好未来教育科技有限公司_202011342345.7

申请/专利权人：北京世纪好未来教育科技有限公司

申请日：2020-11-26

公开（公告）日：2021-04-06

公开（公告）号：CN112395864B

主分类号：G06F40/232(20200101)

分类号：G06F40/232(20200101);G06F40/284(20200101);G06N3/04(20060101);G06N3/08(20060101);G06K9/62(20060101)

优先权：

专利状态码：有效-授权

法律状态：2021.04.06#授权;2021.03.12#实质审查的生效;2021.02.23#公开

摘要：本发明实施例提供了一种文本纠错模型训练、文本纠错方法及相关装置，文本纠错模型训练方法包括：利用文本纠错模型获取噪声文本；获取噪声单词的噪声单词特征，噪声单词特征包括噪声单词字母依赖信息以及噪声文本的单词依赖信息；根据噪声单词特征获取各个训练可能预测单词及其训练单词预测概率，根据各个训练单词预测概率和与噪声单词对应的准确单词的单词准确概率，获取对应的单词相似度；根据各个单词相似度获取文本相似度，根据文本相似度对文本纠错模型的参数进行调整，直至所得到的文本相似度满足相似度阈值，结束文本纠错模型的训练。本发明实施例所提供的文本纠错模型训练、文本纠错方法及相关装置，可以对文本的纠错效果。

主权项：1.一种文本纠错模型训练方法，其特征在于，包括：利用文本纠错模型获取噪声文本，所述噪声文本包括噪声单词；对各个所述噪声单词执行以下操作：获取所述噪声单词的噪声单词特征，其中，所述噪声单词特征包括所述噪声单词的各个噪声字母的字母依赖信息，以及所述噪声文本的各个噪声单词的单词依赖信息；根据所述噪声单词特征获取各个训练可能预测单词和各个训练可能预测单词的训练单词预测概率，根据各个所述训练单词预测概率和与所述噪声单词对应的准确单词的单词准确概率，获取对应的单词相似度；当获取所述噪声文本的各个所述单词相似度时，根据各个所述单词相似度获取文本相似度，根据所述文本相似度对所述文本纠错模型的参数进行调整，直至所得到的文本相似度满足相似度阈值，结束所述文本纠错模型的训练。

全文数据：

权利要求：

百度查询：北京世纪好未来教育科技有限公司文本纠错模型训练、文本纠错方法及相关装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具有多个烹饪腔的新型电锅_蔡少文_202322282891.1

下一篇：一种衬里加工工装_西门子传感器与通讯有限公司_202322280535.6

相关技术

一种具有多个烹饪腔的新型电锅_蔡少文_202322282891.1

一种衬里加工工装_西门子传感器与通讯有限公司_202322280535.6

一种组合式高稳定性数控刀具_德阳特肯机械有限公司_202322142217.3

一种具有预热功能的PCBA生产用点胶机_重庆胜琦隆科技有限公司_202322184609.6

一种酱油发酵罐_滕州市鼎盛酿造有限责任公司_202322235522.7

一种龙卷风路径模拟试验系统_长安大学_202322215336.7

一种管道酸洗钝化装置_义乌市畅通石化管件有限公司_202322204297.0

一种拆卸式滚铁环_张利_202322287414.4

操作装置、机器人系统、制造方法、控制方法和记录介质_佳能株式会社_202311243881.5

一种快速加热水加热器_镇江东方电热科技股份有限公司_202322282423.4

一种混流式转轮通用施焊夹具_洪雅力达水力发电设备有限责任公司_202322285389.6

从多能干细胞产生自然杀伤细胞的方法_武田药品工业株式会社_202280052073.8

龙图腾网&IPTOP

【发明授权】文本纠错模型训练、文本纠错方法及相关装置_北京世纪好未来教育科技有限公司_202011342345.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务