申请/专利权人:三菱电机株式会社
申请日:2018-10-24
公开(公告)日:2020-11-24
公开(公告)号:CN111989742A
主分类号:G10L25/30(20060101)
分类号:G10L25/30(20060101)
优先权:["20180413 US 15/952,330"]
专利状态码:在审-实质审查的生效
法律状态:2020.12.11#实质审查的生效;2020.11.24#公开
摘要:用于语音识别系统的系统和方法,该语音识别系统用于识别包括多个讲话者的交叠语音的语音。该系统包括硬件处理器。计算机储存存储器存储数据并且具有存储于其上的计算机可执行指令,该计算机可执行指令在由处理器执行时将实现所存储的语音识别网络。输入接口接收声学信号,所接收的声学信号包括多个讲话者的语音信号的混合体,其中多个讲话者包括目标讲话者。所存储的语音识别网络的编码器网络和解码器网络被训练为将所接收的声学信号变换为针对每个目标讲话者的文本。使得编码器网络输出一组识别编码,并且解码器网络使用一组识别编码以输出针对每个目标讲话者的文本。输出接口传输针对每个目标讲话者的文本。
主权项:1.一种语音识别系统,该语音识别系统用于识别包括多个讲话者的交叠语音的语音,该语音识别系统包括:硬件处理器;计算机储存存储器,该计算机储存存储器存储数据并且具有存储于其上的计算机可执行指令,该计算机可执行指令在由所述处理器执行时将实现存储的语音识别网络;输入接口,该输入接口接收声学信号,所接收的声学信号包括多个讲话者的语音信号的混合体,其中所述多个讲话者包括目标讲话者;所存储的语音识别网络的编码器网络和解码器网络被训练为将所接收的声学信号变换为针对每个目标讲话者的文本,使得所述编码器网络输出一组识别编码,并且所述解码器网络使用所述一组识别编码以输出针对每个目标讲话者的文本;以及输出接口,该输出接口传输针对每个目标讲话者的所述文本。
全文数据:
权利要求:
百度查询: 三菱电机株式会社 语音识别系统及使用语音识别系统的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。