【发明授权】基于单元点积相似度特征的并行化语音识别模型建立方法_长春理工大学_202311078589.2

导航：龙图腾网> 最新专利技术> 基于单元点积相似度特征的并行化语音识别模型建立方法_长春理工大学_202311078589.2

申请/专利权人：长春理工大学

申请日：2023-08-25

公开（公告）日：2024-03-22

公开（公告）号：CN117133275B

主分类号：G10L15/06

分类号：G10L15/06;G10L15/02;G10L15/16

优先权：

专利状态码：有效-授权

法律状态：2024.03.22#授权;2023.12.15#实质审查的生效;2023.11.28#公开

摘要：基于单元点积相似度特征的并行化语音识别模型建立方法属于语音处理技术领域。本发明提出了单元点积相似度计算方法，该方法既保证了经过等比缩放后的向量之间的相似度仍然一致的特性，又保证了所有向量的相似度结果计算的有界性，有效解决了点积相似度与余弦相似度两种相似度计算中存在的问题。本发明提出了一种新的端到端语音识别模型的优化方法，提出了并行化的贪婪汤算法。根据实验数据以及选用硬件设备的不同，对并行化的贪婪汤算法进一步优化，通过动态分组可以使并行化贪婪汤算法充分利用已有硬件设备的性能，针对大数量的语音数据集具有良好的模型优化效果和时间效率的提升。

主权项：1.基于单元点积相似度特征的并行化语音识别模型建立方法，其特征是：包括以下步骤，并且以下步骤顺次进行，步骤一、待识别语音输入到语音特征处理模块对语音信号进行特征提取，获得待识别语音向量特征；构建语音识别模型，将模型中的向量模长和待识别语音向量特征模长进行归一化处理，让语音向量特征在归一化的数字范围内重新分布；步骤二、将归一化之后的模型向量与待识别语音向量进行点积操作，计算并获得模型向量与待识别语音向量的单元点积相似度；步骤三、将注意力中的缩放系数引入到单元点积相似度中，在点积的结果上乘以一个常数，对模型向量与待识别语音向量归一化之后的数值结果进行缩放，得到缩放后的单元点积相似度从而增加两个向量的区分度；用缩放后的单元点积相似度替代传统注意力机制中查询向量与键向量之间的点积相似度，并以此定义基于单元点积相似度的注意力机制；步骤四、将基于单元点积相似度的注意力机制运用到Transformer和Conformer框架中，在注意力机制下建立编码解码模型，该编码解码模型作为语音识别模型；步骤五、通过采集的开源语音数据集作为训练集对语音识别模型进行训练，一个轮次训练的模型个数由相应硬件配置的GPU个数确定，有N个GPU一个轮次能够同时对连续的N个没判断过的新模型进行并行处理，由于语音识别模型属于神经网络模型，在每个轮次的训练中，神经网络的参数用于存储网络训练过程中学习到的语音信号特征和发音模式；每个轮次的训练均生成不同的模型，根据模型的失真效果，将模型从好到坏进行排序，并依次对模型进行标记，对标记的模型进行所有可能的排列组合，将每个组合训练时用到的神经网络的各参数保存下来，并按照失真度进行排序，取指定组数的模型，对这些模型的参数进行平均获得参数平均模型，再对参数平均后的模型进行筛选，选出各种组合中平均模型失真效果最低的模型集合，对组合中加入的模型下标进行更新，持续进行循环训练，直至最后一个模型加入完成，最后筛选出的模型就是识别效果最好的模型。

全文数据：

权利要求：

百度查询：长春理工大学基于单元点积相似度特征的并行化语音识别模型建立方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

下一篇：一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

相关技术

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

一种高效散热电源_广州市力为电子有限公司_202322175013.X

一种高效型苗种植机_海南勤璞园农业科技有限公司_202322496666.8

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

用于高压柜体的固定防护装置_江苏贯中电气有限公司_202322341188.3

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种火车集卡装卸装置_杭州奥拓机电股份有限公司_202322190678.8

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

语音相关技术

一种语音降噪会议终端_海智合芯科技(深圳)有限公司_202322457355.0

语音识别歧义消除方法及装置_青岛海尔电冰箱有限公司_202211290249.1

一种语音控制风扇_海智合芯科技(深圳)有限公司_202322447146.8

语音设备及其唤醒方法、装置以及存储介质_佛山市顺德区美的电子科技有限公司_202011222715.3

一种语音控制应急广播方法和系统_上海数字电视国家工程研究中心有限公司_201910074869.3

语音交互方法、介质和电子设备_华为技术有限公司_202211293892.X

一种可语音留言互动的显示设备_上海风语筑文化科技股份有限公司_202322391219.6

语音转换方法及装置、存储介质、电子装置_南京硅基智能科技有限公司_202311826046.4

一种语音处理方法及装置_联想(北京)有限公司_202110645953.3

一种语音交互方法，设备和系统_华为技术有限公司_201811644940.9

并行相关技术

一种重型汽车软件并行组动态生成及并行升级系统及方法_陕西重型汽车有限公司_202311579353.7

用于并行处理区块链交易的系统和方法_创新先进技术有限公司_201980003274.7

一种数据并行脱敏处理方法_合芯科技(苏州)有限公司_202310465479.5

用于神经网络的并行逐深度处理架构_高通股份有限公司_202280058042.3

一种核电厂配电盘并行检修方法和系统_深圳中广核工程设计有限公司_202410045963.7

磁通切换型无轴承永磁记忆电机的位移速度并行控制方法_苏州市职业大学_202410024593.9

基于DAG分组的任务并行度调度方法、介质和设备_福建顶点软件股份有限公司_202410299261.1

一种基于大数据的宽度并行交通预测方法、介质及设备_华南理工大学_202410006044.9

针对语言模型的并行调度方法、装置、设备及存储介质_粤港澳大湾区数字经济研究院(福田)_202311237684.2

基于桶状缓冲处理结构的并行快时间维恒虚警实现方法_西安电子科技大学_202410101298.9

化相关技术

玻璃钢化系统_广东顺德添百利科技股份有限公司_202322321586.9

料盒自动化输送装置及料盒自动化输送系统_广汽乘用车(杭州)有限公司_202322231946.6

一种污泥脱水干化一体化设备_江苏康泰环保股份有限公司_202211272836.8

一种连续杂化凝胶长丝的陶瓷化设备_东华大学_202210326220.8

医学图像数据的可视化_西门子医疗有限公司_202010200043.X

样品体积的自数字化_华盛顿大学商业中心_202111601955.9

自动化套口上领设备_内蒙古帕阑蒂科技发展有限公司_202322401589.3

生成参数化空间音频表示_诺基亚技术有限公司_202311364414.8

生成参数化空间音频表示_诺基亚技术有限公司_202311364503.2

非同质化代币信息提供系统_三星显示有限公司_202311339052.7

龙图腾网&IPTOP

【发明授权】基于单元点积相似度特征的并行化语音识别模型建立方法_长春理工大学_202311078589.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务