买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种单路引擎多麦克风语音转写系统与角色分离方法_广东保伦电子股份有限公司_202311119975.1 

申请/专利权人:广东保伦电子股份有限公司

申请日:2023-09-01

公开(公告)日:2024-01-12

公开(公告)号:CN116863966B

主分类号:G10L25/78

分类号:G10L25/78;G10L15/26;G10L19/00;H04L65/403;H04L65/75

优先权:

专利状态码:有效-授权

法律状态:2024.01.12#授权;2023.10.27#实质审查的生效;2023.10.10#公开

摘要:本发明涉及语音转写技术领域,特别是指一种单路引擎多麦克风语音转写系统及角色分离方法,包括音频采集单元、音频编码器、语音识别引擎ASR、语音转写客户端、语音转写服务器、字幕显示大屏;位于会场中的每位参会人面前放置会议单元麦克风,会议单元麦克风通过音频线接入音频编码器,音频编码器通过网络连接语音转写服务器、语音转写服务器通过网络分别连接语音转写客户端、语音转写引擎ASR以及字幕显示大屏。本发明利用单路引擎通过排序转写进行多个会议单元麦克风的语音转写,实现人员角色分离,不需要人员二次编辑,即可实现转写文本的角色分离,减少了资源浪费,更加适用于多人同时说话的会议中的语音识别实时转写。

主权项:1.一种单路引擎多麦克风语音转写系统,其特征在于,包括,音频采集单元,其由若干麦克风组成,对于任一所述麦克风其设置在对应的会议发言端,用于采集对应的会议发言者的讲话音频;音频编码器,其与所述音频采集单元通过音频线相连,用于将音频线传输的音频进行数字压缩编码转换,所述音频编码器在与音频采集单元内设置的若干麦克风相连时,对于不同的麦克风设置有不同编码器通道,任一编码器通道设置有唯一的编码器通道号;语音识别引擎ASR,其与所述音频编码器相连,并能够接受音频编码器传输的数字音频并将接收到的数字音频转写成文本,所述语音识别引擎ASR在进行文本转换的同时,对转换的文本根据不同的编码器通道进行编号;语音转写客户端,其用于开启和关闭语音转写,以及将会议发言者名称与对应编码器通道号进行绑定,并将绑定关系传给语音转写服务器,并存放到数据库中;语音转写服务器,其与所述音频编码器、所述语音识别引擎ASR和所述语音转写客户端通过网络连接,具有存储、处理和传输功能;字幕显示大屏,其与所述语音转写服务器通过网络连接,用于将语音转写服务器发送来的处理结果进行拼接排序并进行显示;中控模块,其与所述音频采集单元、所述音频编码器、所述语音识别引擎ASR、所述语音转写客户端、所述语音转写服务器、所述字幕显示大屏分别相连,所述中控模块通过对所述麦克风采集的音频数据进行分析,判定是否开启对应的编码器通道,当任一编码器通道开启时,中控模块记录其开启时长,当任一编码器通道启动时长达到编码器通道启动时长评价值时,中控模块对该通道存储的音频数据进行分析,确定该编码器通道对应的标准人声;在任一编码器通道的标准人声确定完成后,中控模块对该编码器通道的启动模式进行调节,通过将对应麦克风采集的音频信息与标准人声进行对比,判定是否开启对应的编码器通道;中控模块判定开启对应的编码器通道时,音频编码器对开启对应的编码器通道的音频数据进行编码处理,语音转写引擎ASR对编码处理的音频数据进行文字转换,并通过字幕显示大屏进行显示。

全文数据:

权利要求:

百度查询: 广东保伦电子股份有限公司 一种单路引擎多麦克风语音转写系统与角色分离方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。