【发明公布】语音文本的校正方法和装置_慧科讯业有限公司_202110578619.0

导航：龙图腾网> 最新专利技术> 语音文本的校正方法和装置_慧科讯业有限公司_202110578619.0

申请/专利权人：慧科讯业有限公司

申请日：2021-05-26

公开（公告）日：2022-11-29

公开（公告）号：CN115410555A

主分类号：G10L15/06

分类号：G10L15/06;G10L15/04;G10L15/26;G06F40/289;G06F40/232

优先权：

专利状态码：在审-实质审查的生效

法律状态：2022.12.16#实质审查的生效;2022.11.29#公开

摘要：本发明涉及一种语音文本的校正方法和装置。语音文本的校正方法包括：获取语音文本；利用文本校正模型对语音文本进行校正。生成文本校正模型的方法包括：获取特定领域的新词和包括新词的新词文本；根据新词文本生成训练文本；利用训练文本和掩码语言模型对基于Transformer的语言模型进行训练，生成文本校正模型。本发明的文本校正模型是利用新词和新词文本进行无监督式学习而生成的，因此可以使文本校正模型快速且高效地适应特定领域中不断出现的新词，从而在使用一般的语音识别模型的情况下，仍然能够确保语音文本准确性。

主权项：1.一种生成文本校正模型的方法，所述文本校正模型用于校正语音文本中的新词识别错误，所述方法包括：获取特定领域的新词和包括新词的新词文本11；根据新词文本生成训练文本12；利用所述训练文本和掩码语言模型对基于Transformer的语言模型进行训练，生成文本校正模型13，其中，根据新词文本生成训练文本12的步骤包括：将新词文本切分成多个token；将新词文本中的新词的token替换为掩码token。

全文数据：

权利要求：

百度查询：慧科讯业有限公司语音文本的校正方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：同轴微流控技术制备包水微胶囊的装置及其制备方法_北京化工大学_202410063379.4

下一篇：一种弯管结构模块化设计方法和系统_浙江阿斯克建材科技股份有限公司_202311873791.4

相关技术

同轴微流控技术制备包水微胶囊的装置及其制备方法_北京化工大学_202410063379.4

一种弯管结构模块化设计方法和系统_浙江阿斯克建材科技股份有限公司_202311873791.4

一种自动发现数据质检规则的方法_中电数据产业有限公司_202410002269.7

混料设备_深圳市曼恩斯特科技股份有限公司_202311868560.4

基于神经网络架构搜索的巡检影像无锚框目标检测方法_国网山东省电力公司青岛供电公司_202410060355.3

用于测量组织中成分的绝对浓度值、血流和血量的方法和装置_露曙光医疗股份公司_202180101524.8

电荷泵电路_思瑞浦微电子科技(上海)有限责任公司_202311870614.0

用于自动聚焦的成像方法和成像装置_三星电子株式会社_202310828379.4

基于人体姿态估计和动作识别的跳绳自动计数方法_成都怡康科技有限公司_202410003545.1

数据处理方法、系统和智能电能表_华立科技股份有限公司_202311849804.4

一种虚实结合的遇险救援系统及方法_北京达美盛软件股份有限公司_202311860939.0

一种国土空间规划用地理信息勘测采集设备_武汉永业赛博能规划勘测有限公司_202410226338.2

龙图腾网&IPTOP

【发明公布】语音文本的校正方法和装置_慧科讯业有限公司_202110578619.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务