【发明公布】语音处理、预训练语言模型训练以及语音识别方法_杭州阿里云飞天信息技术有限公司_202311497899.8

申请/专利权人：杭州阿里云飞天信息技术有限公司

申请日：2023-11-09

公开（公告）日：2024-05-03

公开（公告）号：CN117975943A

主分类号：G10L15/06

分类号：G10L15/06;G10L15/16;G10L15/02

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.21#实质审查的生效;2024.05.03#公开

摘要：本说明书实施例提供语音处理、预训练语言模型训练以及语音识别方法，其中所述语音处理方法包括：获取语音处理任务对应的目标语音数据；对目标语音数据进行特征提取，获得目标语音数据的离散特征序列；将离散特征序列输入预训练语言模型，经预训练语言模型的输入单元，基于文本特性对离散特征序列进行分割探索处理，获得分割探索处理结果；经预训练语言模型的编解码单元，根据分割探索处理结果生成目标语音数据对应的处理结果。通过生成离散特征序列，使得语音和文本较为相似，对离散特征序列进行分割探索处理，有效地减少了语音和文本之间的情态差距并保证了语音特性，增强了预训练语言模型在理解和响应语音输入的适应性，提高了语音处理性能。

主权项：1.一种语音处理方法，包括：获取语音处理任务对应的目标语音数据；对所述目标语音数据进行特征提取，获得所述目标语音数据的离散特征序列；将所述离散特征序列输入预训练语言模型，经所述预训练语言模型的输入单元，基于文本特性对所述离散特征序列进行分割探索处理，获得分割探索处理结果；经所述预训练语言模型的编解码单元，根据所述分割探索处理结果生成所述目标语音数据对应的处理结果。

全文数据：

权利要求：

百度查询：杭州阿里云飞天信息技术有限公司语音处理、预训练语言模型训练以及语音识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于注意力机制的神经网络故障修复方法、图像分类模型、图像分类方法_杭州市滨江区浙工大网络空间安全创新研究院_202410392054.0

下一篇：基于可再生能源发电的氢与氨储能系统建模方法_天津大学_202410327379.0

相关技术

一种基于注意力机制的神经网络故障修复方法、图像分类模型、图像分类方法_杭州市滨江区浙工大网络空间安全创新研究院_202410392054.0

基于可再生能源发电的氢与氨储能系统建模方法_天津大学_202410327379.0

一种带材轧制中在线检测反馈控制方法_江苏康瑞新材料科技股份有限公司_202410090095.4

一种数据采集方法_深圳盈达信息科技有限公司_202410260237.7

显示面板的驱动电路和显示装置_重庆惠科金渝光电科技有限公司_202410070909.8

用于胃癌新辅助化疗敏感人群筛查和疗效动态监测的血浆外泌体蛋白标志物体系及其应用_北京肿瘤医院(北京大学肿瘤医院)_202410179178.0

一种混凝土砂浆废水泡沫的消除装置_沧州市凯悦商砼有限公司_202410231805.0

基于大数据分析的智慧工厂管理方法_杭州云天软件股份有限公司_202410049033.9

基于图异常检测算法的网络入侵检测方法、系统及介质_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202410445603.6

闸机结构_浙江优纳特科学仪器有限公司_202410384536.1

基于互补结构的高选择性三带通频率选择表面_电子科技大学_202410360623.3

一种救生筏复合材料的生产设备及其生产工艺_烟台华洋救生装备制造有限公司_202410415235.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】语音处理、预训练语言模型训练以及语音识别方法_杭州阿里云飞天信息技术有限公司_202311497899.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务