【发明公布】车载多人实时智能语音交互系统_南京龙垣信息科技有限公司_202410160194.5

导航：龙图腾网> 最新专利技术> 车载多人实时智能语音交互系统_南京龙垣信息科技有限公司_202410160194.5

申请/专利权人：南京龙垣信息科技有限公司

申请日：2024-02-05

公开（公告）日：2024-04-09

公开（公告）号：CN117854517A

主分类号：G10L19/008

分类号：G10L19/008;G10L19/02;G10L13/02;G10L15/18;G10L15/26;G10L25/18;G10L25/21;G10L25/24

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.26#实质审查的生效;2024.04.09#公开

摘要：本发明涉及车载智能语音技术领域，具体涉及一种车载多人实时智能语音交互系统；包括声音采集模块、多通道语音增强模块、语音识别模块、自然语音处理模块和语音合成模块，使用车载语音时，通过声音采集模块对声源进行采集，多通道语音增强模块将采集的声源进行多通道自注意力语音增强，随后语音识别模块通过时频域的多通道对齐与语音活动检测后的音频进行说话人聚类，利用自然语音处理模块进行实时语音识别将说话人音频进行语音转文字，最后语音合成模块将转换后的实时转换文字按目标说话人声源进行人机交互处理，实现了能够提高语音的识别率，减少噪声干扰，更准确的远距离语音识别，提升了用户的体验。

主权项：1.一种车载多人实时智能语音交互系统，其特征在于，包括声音采集模块、多通道语音增强模块、语音识别模块、自然语音处理模块和语音合成模块，所述多通道语音增强模块与所述声音采集模块连接，所述语音识别模块与所述多通道语音增强模块连接，所述自然语音处理模块与所述语音识别模块连接，所述语音合成模块与所述自然语音处理模块连接；所述声音采集模块用于对声源进行采集，得到多通道音频数据；所述多通道语音增强模块用于将采集的多通道音频数据进行多通道自注意力语音增强，提取降低多通道导致的定位延迟与混响特性，基于多通道输入背景影响关联性，减少场景噪声；所述语音识别模块用于通过时频域的多通道对齐与语音活动检测后的音频进行说话人聚类；所述自然语音处理模块用于进行实时语音识别将说话人音频进行语音转文字；所述语音合成模块用于将转换后的实时转换文字按目标说话人声源进行人机交互处理，并通过语音合成技术进行回复。

全文数据：

权利要求：

百度查询：南京龙垣信息科技有限公司车载多人实时智能语音交互系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

下一篇：电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

相关技术

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

整形压块及焊接装置_宁德时代新能源科技股份有限公司_202321970130.9

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

一种具有服药求助警报功能的药丸储存项链_杨洁_202322091839.8

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种天然气管道不停输开孔装置_盐城新奥燃气有限公司_202322202238.X

一种高效型苗种植机_海南勤璞园农业科技有限公司_202322496666.8

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

龙图腾网&IPTOP

【发明公布】车载多人实时智能语音交互系统_南京龙垣信息科技有限公司_202410160194.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务