买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】移动终端与车载终端的同步语音识别系统及方法_武汉卡比特信息有限公司_201811378005.2 

申请/专利权人:武汉卡比特信息有限公司

申请日:2018-11-19

公开(公告)日:2021-10-12

公开(公告)号:CN109618305B

主分类号:H04W4/48(20180101)

分类号:H04W4/48(20180101);H04W56/00(20090101);H04W76/10(20180101);G10L13/04(20130101);G10L15/26(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.10.12#授权;2019.05.07#实质审查的生效;2019.04.12#公开

摘要:本发明公开了一种移动终端与车载终端的同步语音识别系统,语音识别模块将获取的预播放的文本转换成音频流数据,并将音频流数据传输给录音播放控制器;录音播放控制器将收到的音频流数据通过音响进行播放;录音播放控制器根据应用程序编程接口获取当前音频流数据播放进度,并通过当前音频流数据播放进度判断播放是否完成;录音播放控制器在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块,语音识别模块在接收到音频流数据播放完毕通知信号后通过向麦克风发送录音开启指令,麦克风开启录音后将录制的语音信息传输给语音识别模块进行语音识别。本发明录音机录制的数据非常干净,提高了用户体验。

主权项:1.一种移动终端与车载终端的同步语音识别系统,它包括计算机类终端1的录音播放控制器1.1和移动终端2的语音识别模块2.1,所述录音播放控制器1.1与语音识别模块2.1之间建立数据传输通道;所述语音识别模块2.1用于将获取的预播放的文本转换成音频流数据,并将音频流数据传输给录音播放控制器1.1;所述录音播放控制器1.1用于将收到的音频流数据通过音响1.3进行播放;录音播放控制器1.1还用于根据应用程序编程接口获取当前音频流数据播放进度,并通过当前音频流数据播放进度判断播放是否完成;录音播放控制器1.1还用于在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1,语音识别模块2.1还用于在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2发送录音开启指令,麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别;所述语音识别模块2.1用于将获取的预播放的文本通过文字转语音技术转换成音频流数据;音频流数据播放完毕通知信号,录音开启指令,移动终端应用程序控制指令均采用自定义的TCP或UDP数据包,上述录音播放控制器1.1与语音识别模块2.1之间建立的数据传输通道,为基于TCPUDP协议的数据传输通道。

全文数据:移动终端与车载终端的同步语音识别系统及方法技术领域本发明涉及计算机技术领域,具体地指一种移动终端与车载终端的同步语音识别系统及方法。背景技术随着技术的不断发展,当下移动终端手机与其它计算机类终端的通讯交互很常见,例如目前很多汽车的车载终端TCU,TransmissionControlUnit都有蓝牙功能,车载终端与移动终端之间可以通过蓝牙进行连接,移动终端使用语音助手时,声音通过蓝牙在车载音响中播放,但是车载蓝牙一般都会对声音进行缓存,这样就会造成播放的时间线比手机自身播放延迟,这样车载终端无法准确的知道何时开启录音,如果录音开启的过早就会把蓝牙最后播放的文字录制进去,如果开启的过晚,就会漏录制用户的语音,影响了客户的使用体验。发明内容本发明的目的就是要提供一种移动终端与车载终端的同步语音识别系统及方法,本发明在语音识别播放时,把播放的内容发送给车载终端播放,车载终端播放完毕后,通知移动终端开始录音,并把车载终端的录音数据传递给移动终端开始识别,实现了车载终端对移动终端语音数据的同步播放。为实现此目的,本发明所设计的一种移动终端与车载终端的同步语音识别系统,它包括计算机类终端的录音播放控制器和移动终端的语音识别模块,所述录音播放控制器与语音识别模块之间建立数据传输通道;所述语音识别模块用于将获取的预播放的文本转换成音频流数据,并将音频流数据传输给录音播放控制器;所述录音播放控制器用于将收到的音频流数据通过音响进行播放;录音播放控制器还用于根据应用程序编程接口获取当前音频流数据播放进度,并通过当前音频流数据播放进度判断播放是否完成;录音播放控制器还用于在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块,语音识别模块还用于在接收到音频流数据播放完毕通知信号后通过录音播放控制器向麦克风发送录音开启指令,麦克风开启录音后将录制的语音信息通过录音播放控制器传输给语音识别模块进行语音识别。本发明的技术方案中,车载终端的录音播报控制器收到音频流后,开始播报,判断播报完成后,立即发送播放完毕指令给手机;同时开启车载终端上的录音机,把录音数据传递给移动终端的语音识别模块;由于此时声音刚好播放完成,相比传统的蓝牙传输方案蓝牙会把播报的末尾1~2秒播报录制进来,干扰语音识别数据,本发明录音机录制的数据非常干净,大幅提高语音识别准确率,提高了用户体验。附图说明图1为本发明的结构示意图;图2为本发明的流程图。其中,1—计算机类终端、1.1—录音播放控制器、1.2—麦克风、1.3—音响、2—移动终端、2.1—语音识别模块。具体实施方式以下结合附图和具体实施例对本发明作进一步的详细说明:一种移动终端与车载终端的同步语音识别系统,如图1所示,它包括计算机类终端1的录音播放控制器1.1和移动终端2的语音识别模块2.1,所述录音播放控制器1.1与语音识别模块2.1之间建立数据传输通道USB或WIFI互联通道,互联技术为目前行业内现有的技术,如专利201310095336.6所揭露;所述语音识别模块2.1用于将获取的预播放的文本由手机内的应用程序预制,主要为对用户的询问句式,如需要帮忙么之类转换成音频流数据,并将音频流数据传输给录音播放控制器1.1;所述录音播放控制器1.1用于将收到的音频流数据通过音响1.3进行播放;录音播放控制器1.1还用于根据应用程序编程接口API,ApplicationProgrammingInterface获取当前音频流数据播放进度,并通过当前音频流数据播放进度判断播放是否完成;录音播放控制器1.1还用于在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1,语音识别模块2.1还用于在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2所述麦克风1.2为装有相应的软件驱动的单个麦克风或麦克风阵列发送录音开启指令,麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别。上述技术方案中,所述语音识别模块2.1用于将录制的语音信息通过语音识别技术ASR,AutomaticSpeechRecognition转换成语义文本。上述技术方案中,所述语音识别模块2.1可利用科大讯飞或其他方案商的语音识别引擎进行语义分析,并根据语义分析的结果发出移动终端应用程序控制指令。上述技术方案中,所述语音识别模块2.1用于将获取的预播放的文本通过文字转语音技术TTS,text-to-speech转换成音频流数据。上述技术方案中,手机的语音识别模块2.1开始工作时,首先把要播报的文本转成音频流;此操作采用TTS技术可以在毫秒级处理完成,需要播放的音频数据产生后,立即传输给计算机类终端1的录音播放控制器1.1;相比于蓝牙传输方案,此方案省去了在手机端播放此音频,蓝牙模块再重新采样后,再把音频数据传输给计算机类终端的动作,语音识别的实时性大幅提高。上述技术方案中,计算机类终端1可以为智能仪表盘、DADisplayAudio屏系统、智能后视镜系统、导航仪或头枕屏或平视显示器HeadUpDisplay等。移动终端可以为智能手机或平板电脑等。录音播放控制器1.1通过在车载终端内由JAVA或C++编写构建。语音识别模块2.1可由科大讯飞或其他方案商提供的语音识别引擎软件开发工具包SDK,SoftwareDevelopmentKit编写构建。上述技术方案中,录音播放控制器1.1根据应用程序编程接口获取当前音频流数据播放进度,当进度达到100%时判断播放完成。一种基于上述系统的移动终端与车载终端的同步语音识别方法,如图2所示,它包括如下步骤:步骤1:计算机类终端1的录音播放控制器1.1与移动终端2的语音识别模块2.1之间建立数据传输通道;步骤2:语音识别模块2.1将获取的预播放的文本转换成音频流数据,并将音频流数据传输给录音播放控制器1.1;步骤3:所述录音播放控制器1.1将收到的音频流数据通过音响1.3进行播放;录音播放控制器1.1根据应用程序编程接口获取当前音频流数据播放进度,并通过当前音频流数据播放进度判断播放是否完成;如果播放完成则进入步骤4,如果播放没有完成则继续播放;步骤4:录音播放控制器1.1在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1,语音识别模块2.1在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2发送录音开启指令,麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别;步骤5:语音识别模块2.1将录制的语音信息通过语音识别技术转换成语义文本;步骤6:所述语音识别模块2.1利用语音识别引擎进行语义分析,并根据语义分析的结果发出移动终端应用程序控制指令。上述技术方案中,音频流数据播放完毕通知信号,录音开启指令,移动终端应用程序控制指令均采用自定义的TCPTransmissionControlProtocol,传输控制协议或UDPUserDatagramProtocol用户数据报协议数据包。上述录音播放控制器1.1与语音识别模块2.1之间建立的数据传输通道,为基于TCPUDP协议的数据传输通道。本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。

权利要求:1.一种移动终端与车载终端的同步语音识别系统,它包括计算机类终端1的录音播放控制器1.1和移动终端2的语音识别模块2.1,所述录音播放控制器1.1与语音识别模块2.1之间建立数据传输通道;所述语音识别模块2.1用于将获取的预播放的文本转换成音频流数据,并将音频流数据传输给录音播放控制器1.1;所述录音播放控制器1.1用于将收到的音频流数据通过音响1.3进行播放;录音播放控制器1.1还用于根据应用程序编程接口获取当前音频流数据播放进度,并通过当前音频流数据播放进度判断播放是否完成;录音播放控制器1.1还用于在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1,语音识别模块2.1还用于在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2发送录音开启指令,麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别。2.根据权利要求1所述的移动终端与车载终端的同步语音识别系统,其特征在于:所述语音识别模块2.1用于将录制的语音信息通过语音识别技术转换成语义文本。3.根据权利要求1所述的移动终端与车载终端的同步语音识别系统,其特征在于:所述语音识别模块2.1利用语音识别引擎进行语义分析,并根据语义分析的结果发出移动终端应用程序控制指令。4.根据权利要求1所述的移动终端与车载终端的同步语音识别系统,其特征在于:所述语音识别模块2.1用于将获取的预播放的文本通过文字转语音技术转换成音频流数据。5.根据权利要求1所述的移动终端与车载终端的同步语音识别系统,其特征在于:录音播放控制器1.1根据应用程序编程接口获取当前音频流数据播放进度,当进度达到100%时判断播放完成。6.一种基于权利要求1所述系统的移动终端与车载终端的同步语音识别方法,其特征在于,它包括如下步骤:步骤1:计算机类终端1的录音播放控制器1.1与移动终端2的语音识别模块2.1之间建立数据传输通道;步骤2:语音识别模块2.1将获取的预播放的文本转换成音频流数据,并将音频流数据传输给录音播放控制器1.1;步骤3:所述录音播放控制器1.1将收到的音频流数据通过音响1.3进行播放;录音播放控制器1.1根据应用程序编程接口获取当前音频流数据播放进度,并通过当前音频流数据播放进度判断播放是否完成;如果播放完成则进入步骤4,如果播放没有完成则继续播放;步骤4:录音播放控制器1.1在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1,语音识别模块2.1在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2发送录音开启指令,麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别。7.根据权利要求6所述的移动终端与车载终端的同步语音识别方法,其特征在于:所述步骤4后还包括步骤5:语音识别模块2.1将录制的语音信息通过语音识别技术转换成语义文本;步骤6:所述语音识别模块2.1利用语音识别引擎进行语义分析,并根据语义分析的结果发出移动终端应用程序控制指令。

百度查询: 武汉卡比特信息有限公司 移动终端与车载终端的同步语音识别系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。