【发明授权】移动终端与车载终端的同步语音识别系统及方法_武汉卡比特信息有限公司_201811378005.2

申请/专利权人：武汉卡比特信息有限公司

申请日：2018-11-19

公开（公告）日：2021-10-12

公开（公告）号：CN109618305B

主分类号：H04W4/48(20180101)

分类号：H04W4/48(20180101);H04W56/00(20090101);H04W76/10(20180101);G10L13/04(20130101);G10L15/26(20060101)

优先权：

专利状态码：有效-授权

法律状态：2021.10.12#授权;2019.05.07#实质审查的生效;2019.04.12#公开

摘要：本发明公开了一种移动终端与车载终端的同步语音识别系统，语音识别模块将获取的预播放的文本转换成音频流数据，并将音频流数据传输给录音播放控制器；录音播放控制器将收到的音频流数据通过音响进行播放；录音播放控制器根据应用程序编程接口获取当前音频流数据播放进度，并通过当前音频流数据播放进度判断播放是否完成；录音播放控制器在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块，语音识别模块在接收到音频流数据播放完毕通知信号后通过向麦克风发送录音开启指令，麦克风开启录音后将录制的语音信息传输给语音识别模块进行语音识别。本发明录音机录制的数据非常干净，提高了用户体验。

主权项：1.一种移动终端与车载终端的同步语音识别系统，它包括计算机类终端1的录音播放控制器1.1和移动终端2的语音识别模块2.1，所述录音播放控制器1.1与语音识别模块2.1之间建立数据传输通道；所述语音识别模块2.1用于将获取的预播放的文本转换成音频流数据，并将音频流数据传输给录音播放控制器1.1；所述录音播放控制器1.1用于将收到的音频流数据通过音响1.3进行播放；录音播放控制器1.1还用于根据应用程序编程接口获取当前音频流数据播放进度，并通过当前音频流数据播放进度判断播放是否完成；录音播放控制器1.1还用于在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1，语音识别模块2.1还用于在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2发送录音开启指令，麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别；所述语音识别模块2.1用于将获取的预播放的文本通过文字转语音技术转换成音频流数据；音频流数据播放完毕通知信号，录音开启指令，移动终端应用程序控制指令均采用自定义的TCP或UDP数据包，上述录音播放控制器1.1与语音识别模块2.1之间建立的数据传输通道，为基于TCPUDP协议的数据传输通道。

全文数据：移动终端与车载终端的同步语音识别系统及方法技术领域本发明涉及计算机技术领域，具体地指一种移动终端与车载终端的同步语音识别系统及方法。背景技术随着技术的不断发展，当下移动终端手机与其它计算机类终端的通讯交互很常见，例如目前很多汽车的车载终端TCU，TransmissionControlUnit都有蓝牙功能，车载终端与移动终端之间可以通过蓝牙进行连接，移动终端使用语音助手时，声音通过蓝牙在车载音响中播放，但是车载蓝牙一般都会对声音进行缓存，这样就会造成播放的时间线比手机自身播放延迟，这样车载终端无法准确的知道何时开启录音，如果录音开启的过早就会把蓝牙最后播放的文字录制进去，如果开启的过晚，就会漏录制用户的语音，影响了客户的使用体验。发明内容本发明的目的就是要提供一种移动终端与车载终端的同步语音识别系统及方法，本发明在语音识别播放时,把播放的内容发送给车载终端播放,车载终端播放完毕后,通知移动终端开始录音,并把车载终端的录音数据传递给移动终端开始识别，实现了车载终端对移动终端语音数据的同步播放。为实现此目的，本发明所设计的一种移动终端与车载终端的同步语音识别系统，它包括计算机类终端的录音播放控制器和移动终端的语音识别模块，所述录音播放控制器与语音识别模块之间建立数据传输通道；所述语音识别模块用于将获取的预播放的文本转换成音频流数据，并将音频流数据传输给录音播放控制器；所述录音播放控制器用于将收到的音频流数据通过音响进行播放；录音播放控制器还用于根据应用程序编程接口获取当前音频流数据播放进度，并通过当前音频流数据播放进度判断播放是否完成；录音播放控制器还用于在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块，语音识别模块还用于在接收到音频流数据播放完毕通知信号后通过录音播放控制器向麦克风发送录音开启指令，麦克风开启录音后将录制的语音信息通过录音播放控制器传输给语音识别模块进行语音识别。本发明的技术方案中，车载终端的录音播报控制器收到音频流后，开始播报，判断播报完成后,立即发送播放完毕指令给手机；同时开启车载终端上的录音机，把录音数据传递给移动终端的语音识别模块；由于此时声音刚好播放完成，相比传统的蓝牙传输方案蓝牙会把播报的末尾1～2秒播报录制进来，干扰语音识别数据，本发明录音机录制的数据非常干净，大幅提高语音识别准确率，提高了用户体验。附图说明图1为本发明的结构示意图；图2为本发明的流程图。其中，1—计算机类终端、1.1—录音播放控制器、1.2—麦克风、1.3—音响、2—移动终端、2.1—语音识别模块。具体实施方式以下结合附图和具体实施例对本发明作进一步的详细说明：一种移动终端与车载终端的同步语音识别系统，如图1所示，它包括计算机类终端1的录音播放控制器1.1和移动终端2的语音识别模块2.1，所述录音播放控制器1.1与语音识别模块2.1之间建立数据传输通道USB或WIFI互联通道，互联技术为目前行业内现有的技术，如专利201310095336.6所揭露；所述语音识别模块2.1用于将获取的预播放的文本由手机内的应用程序预制，主要为对用户的询问句式，如需要帮忙么之类转换成音频流数据，并将音频流数据传输给录音播放控制器1.1；所述录音播放控制器1.1用于将收到的音频流数据通过音响1.3进行播放；录音播放控制器1.1还用于根据应用程序编程接口API，ApplicationProgrammingInterface获取当前音频流数据播放进度，并通过当前音频流数据播放进度判断播放是否完成；录音播放控制器1.1还用于在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1，语音识别模块2.1还用于在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2所述麦克风1.2为装有相应的软件驱动的单个麦克风或麦克风阵列发送录音开启指令，麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别。上述技术方案中，所述语音识别模块2.1用于将录制的语音信息通过语音识别技术ASR，AutomaticSpeechRecognition转换成语义文本。上述技术方案中，所述语音识别模块2.1可利用科大讯飞或其他方案商的语音识别引擎进行语义分析，并根据语义分析的结果发出移动终端应用程序控制指令。上述技术方案中，所述语音识别模块2.1用于将获取的预播放的文本通过文字转语音技术TTS，text-to-speech转换成音频流数据。上述技术方案中，手机的语音识别模块2.1开始工作时，首先把要播报的文本转成音频流；此操作采用TTS技术可以在毫秒级处理完成，需要播放的音频数据产生后，立即传输给计算机类终端1的录音播放控制器1.1；相比于蓝牙传输方案，此方案省去了在手机端播放此音频，蓝牙模块再重新采样后，再把音频数据传输给计算机类终端的动作，语音识别的实时性大幅提高。上述技术方案中，计算机类终端1可以为智能仪表盘、DADisplayAudio屏系统、智能后视镜系统、导航仪或头枕屏或平视显示器HeadUpDisplay等。移动终端可以为智能手机或平板电脑等。录音播放控制器1.1通过在车载终端内由JAVA或C++编写构建。语音识别模块2.1可由科大讯飞或其他方案商提供的语音识别引擎软件开发工具包SDK，SoftwareDevelopmentKit编写构建。上述技术方案中，录音播放控制器1.1根据应用程序编程接口获取当前音频流数据播放进度，当进度达到100％时判断播放完成。一种基于上述系统的移动终端与车载终端的同步语音识别方法，如图2所示，它包括如下步骤：步骤1：计算机类终端1的录音播放控制器1.1与移动终端2的语音识别模块2.1之间建立数据传输通道；步骤2：语音识别模块2.1将获取的预播放的文本转换成音频流数据，并将音频流数据传输给录音播放控制器1.1；步骤3：所述录音播放控制器1.1将收到的音频流数据通过音响1.3进行播放；录音播放控制器1.1根据应用程序编程接口获取当前音频流数据播放进度，并通过当前音频流数据播放进度判断播放是否完成；如果播放完成则进入步骤4，如果播放没有完成则继续播放；步骤4：录音播放控制器1.1在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1，语音识别模块2.1在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2发送录音开启指令，麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别；步骤5：语音识别模块2.1将录制的语音信息通过语音识别技术转换成语义文本；步骤6：所述语音识别模块2.1利用语音识别引擎进行语义分析，并根据语义分析的结果发出移动终端应用程序控制指令。上述技术方案中，音频流数据播放完毕通知信号，录音开启指令，移动终端应用程序控制指令均采用自定义的TCPTransmissionControlProtocol，传输控制协议或UDPUserDatagramProtocol用户数据报协议数据包。上述录音播放控制器1.1与语音识别模块2.1之间建立的数据传输通道，为基于TCPUDP协议的数据传输通道。本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。

权利要求：1.一种移动终端与车载终端的同步语音识别系统，它包括计算机类终端1的录音播放控制器1.1和移动终端2的语音识别模块2.1，所述录音播放控制器1.1与语音识别模块2.1之间建立数据传输通道；所述语音识别模块2.1用于将获取的预播放的文本转换成音频流数据，并将音频流数据传输给录音播放控制器1.1；所述录音播放控制器1.1用于将收到的音频流数据通过音响1.3进行播放；录音播放控制器1.1还用于根据应用程序编程接口获取当前音频流数据播放进度，并通过当前音频流数据播放进度判断播放是否完成；录音播放控制器1.1还用于在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1，语音识别模块2.1还用于在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2发送录音开启指令，麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别。2.根据权利要求1所述的移动终端与车载终端的同步语音识别系统，其特征在于：所述语音识别模块2.1用于将录制的语音信息通过语音识别技术转换成语义文本。3.根据权利要求1所述的移动终端与车载终端的同步语音识别系统，其特征在于：所述语音识别模块2.1利用语音识别引擎进行语义分析，并根据语义分析的结果发出移动终端应用程序控制指令。4.根据权利要求1所述的移动终端与车载终端的同步语音识别系统，其特征在于：所述语音识别模块2.1用于将获取的预播放的文本通过文字转语音技术转换成音频流数据。5.根据权利要求1所述的移动终端与车载终端的同步语音识别系统，其特征在于：录音播放控制器1.1根据应用程序编程接口获取当前音频流数据播放进度，当进度达到100％时判断播放完成。6.一种基于权利要求1所述系统的移动终端与车载终端的同步语音识别方法，其特征在于，它包括如下步骤：步骤1：计算机类终端1的录音播放控制器1.1与移动终端2的语音识别模块2.1之间建立数据传输通道；步骤2：语音识别模块2.1将获取的预播放的文本转换成音频流数据，并将音频流数据传输给录音播放控制器1.1；步骤3：所述录音播放控制器1.1将收到的音频流数据通过音响1.3进行播放；录音播放控制器1.1根据应用程序编程接口获取当前音频流数据播放进度，并通过当前音频流数据播放进度判断播放是否完成；如果播放完成则进入步骤4，如果播放没有完成则继续播放；步骤4：录音播放控制器1.1在音频流数据播放完成后发送音频流数据播放完毕通知信号给语音识别模块2.1，语音识别模块2.1在接收到音频流数据播放完毕通知信号后通过录音播放控制器1.1向麦克风1.2发送录音开启指令，麦克风1.2开启录音后将录制的语音信息通过录音播放控制器1.1传输给语音识别模块2.1进行语音识别。7.根据权利要求6所述的移动终端与车载终端的同步语音识别方法，其特征在于：所述步骤4后还包括步骤5：语音识别模块2.1将录制的语音信息通过语音识别技术转换成语义文本；步骤6：所述语音识别模块2.1利用语音识别引擎进行语义分析，并根据语义分析的结果发出移动终端应用程序控制指令。

百度查询：武汉卡比特信息有限公司移动终端与车载终端的同步语音识别系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种液体检测电路及其设备_深圳市希莱恒医用电子有限公司_202311863592.5

下一篇：兼顾土壤增碳扩容与养分增效的盐碱地改良剂及其应用_中国科学院南京土壤研究所_202311563903.6

相关技术

一种液体检测电路及其设备_深圳市希莱恒医用电子有限公司_202311863592.5

兼顾土壤增碳扩容与养分增效的盐碱地改良剂及其应用_中国科学院南京土壤研究所_202311563903.6

光波导组件、光波导及显示装置_华为技术有限公司_202211180160.X

信息处理方法、终端、服务器、电子设备及存储介质_腾讯科技(深圳)有限公司_202211168044.6

从多能干细胞产生自然杀伤细胞的方法_武田药品工业株式会社_202280052073.8

一种自动折叠试验装置_江苏金陵智造研究院有限公司_202311552988.8

一种存储器及电子设备_华为技术有限公司_202211196521.X

一种蜗轮蜗杆直插式蝶阀_江苏江沅机械有限公司_202311671901.9

沿空缺陷型宽煤柱冲击地压防治方法和装置_华亭煤业集团有限责任公司_202211178548.6

同轴微流控技术制备包水微胶囊的装置及其制备方法_北京化工大学_202410063379.4

一种断路器、断路器适配方法及装置_上海良信电器股份有限公司_202211166634.5

一种列车控制单元自动化测试系统及测试方法_株洲中车时代电气股份有限公司_202211176283.6

语音相关技术

语音交互设备和语音交互方法_海信电子科技(武汉)有限公司_202311356078.2

多模式语音定位_微软技术许可有限责任公司_201980030506.8

语音合成模型学习装置、语音合成模型学习方法及存储介质_株式会社东芝_202111029334.8

语音服务改进方法及系统_壹药网科技(上海)股份有限公司_202410078056.2

语音交互式户外灯杆_浙江晶日科技股份有限公司_202322451890.5

显示设备和语音识别方法_VIDAA国际控股(荷兰)公司_202310572752.4

语音识别方法及其装置_北京华宇信息技术有限公司_202011295150.1

语音业务的处理方法及装置_大唐移动通信设备有限公司_202211167922.2

显示设备及语音搜索方法_海信视像科技股份有限公司_202311551549.5

语音采集方法、装置及设备_科沃斯商用机器人有限公司_201810746846.8

同步相关技术

避免同步过程冲突的文件同步方法和装置_山石网科通信技术股份有限公司_202210912394.2

一种频率同步网辅助时间同步网的时间同步方法及设备_中国科学院微电子研究所_202311810254.5

转子参数数据遥测传输的时间同步电路及同步方法_中国航发四川燃气涡轮研究院_202211046795.0

侧行链路同步协助_高通股份有限公司_202180008112.X

一种磁阻同步电机_巧力电机有限公司_202311873887.0

数字资产的基于分量的同步_奥多比公司_201810368908.6

金属壳体的同步切边模具_苏州丰川电子科技有限公司_202322197355.1

椭圆形同步气缸_东莞市沃成科技有限公司_202410120950.1

数据同步方法及电子设备_华为技术有限公司_202211608751.2

一种同步方法、装置、设备及介质_上海银基信息安全技术股份有限公司_202311846538.X

终端相关技术

终端后盖和终端_北京小米移动软件有限公司_202322278235.4

终端认证设备、终端认证系统和终端认证方法_瑞萨电子株式会社_201910483950.7

终端保持件及终端收纳壳体_阿克比动作学校株式会社_201980053878.2

移动终端_OPPO广东移动通信有限公司_202111368388.7

自助金融终端控制方法、装置、终端及可读介质_深圳怡化电脑股份有限公司_202010512004.3

终端以及通信方法_株式会社NTT都科摩_202180101558.7

一种移动终端_华为技术有限公司_202211208965.0

用户终端以及无线基站_株式会社NTT都科摩_201880095698.6

用户终端以及无线基站_株式会社NTT都科摩_201880094430.0

安全协定装置、验证方法、终端装置与终端装置执行的方法_国际信任机器股份有限公司_201910676092.8

龙图腾网&IPTOP

【发明授权】移动终端与车载终端的同步语音识别系统及方法_武汉卡比特信息有限公司_201811378005.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务