申请/专利权人:视联动力信息技术股份有限公司
申请日:2023-12-29
公开(公告)日:2024-03-29
公开(公告)号:CN117789749A
主分类号:G10L21/0272
分类号:G10L21/0272;G10L25/51;G10L15/26;H04L12/18;H04L65/1083;H04L65/403
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.16#实质审查的生效;2024.03.29#公开
摘要:本申请提供了一种音频转译方法及音频转译服务器、设备及存储介质,其中,对目标用户端请求转译的待转译音频流进行声纹分割得到多个子音频流和各子音频流所对应的发言人信息;调用SDK服务器对各子音频流进行语音识别得到各子音频流所对应的文字内容;将各子音频流、各子音频流所对应的发言人信息以及各子音频流所对应的文字内容发送至所述目标用户端进行展示。采用上述方法,以减少在进行音频转译时所需耗费的人力成本,同时提高音频转译结果的准确性。
主权项:1.一种音频转译方法,其特征在于,所述方法包括:对目标用户端请求转译的待转译音频流进行声纹分割得到多个子音频流和各子音频流所对应的发言人信息;调用SDK服务器对各子音频流进行语音识别得到各子音频流所对应的文字内容;将各子音频流、各子音频流所对应的发言人信息以及各子音频流所对应的文字内容发送至所述目标用户端进行展示。
全文数据:
权利要求:
百度查询: 视联动力信息技术股份有限公司 一种音频转译方法及音频转译服务器、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。