买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种视讯系统的实时音频择路方法_杭州全能数字科技有限公司_202310533844.1 

申请/专利权人:杭州全能数字科技有限公司

申请日:2023-05-12

公开(公告)日:2024-02-13

公开(公告)号:CN116471263B

主分类号:H04L65/80

分类号:H04L65/80;H04L65/752;H04L65/75;H04L65/403;H04L65/65;H04N7/15;G10L19/26;G10L21/007;G10L25/60;G06F3/16

优先权:

专利状态码:有效-授权

法律状态:2024.02.13#授权;2023.08.08#实质审查的生效;2023.07.21#公开

摘要:本发明公开了一种视讯系统的实时音频择路方法,属于音频处理技术领域,方法包括:步骤一、设置音频择路最大激活路数K;步骤二、媒体服务从网络接收数据,并解析为RTP音频数据;步骤三、将获得的RTP音频数据进行处理后插入到滑动窗口;步骤四、判断当前激活的音频路数是否超过设置的最大激活路数K,若为否,则将RTP音频数据直接投递到音频管道。本发明实时对输入的每路语音进行择路,选择出音量最大的k路语音流送到端上,这种方案首先节省了语音混流对服务器大量资源的消耗,其次送到端上的流都是独立的,较为容易做音画同步,使用户获取的声音更加流畅真实。

主权项:1.一种视讯系统的实时音频择路方法,其特征在于,所述方法包括:步骤一、设置音频择路最大激活路数K;步骤二、媒体服务从网络接收数据,并解析为RTP音频数据;步骤三、将获得的RTP音频数据进行处理后插入到滑动窗口;步骤四、判断当前激活的音频路数是否超过设置的最大激活路数K,若为否,则将RTP音频数据直接投递到音频管道,否则进行步骤五;步骤五、对每路语音的滑动窗口求和,使用TOP-K算法选出K路,判断当前输入源是否属于K,若为是,则将音频数据输入音频管道,否则丢弃;步骤六、将输入音频管道的音频数据进行音量处理后传输到广播播报系统进行播报;所述步骤六中音量处理的方法为:获取每段音频数据的音频波形图,根据音频波形图来获取音频数据的响度值以及音调值,根据响度值以及音调值的变化来求得该段音频数据的质量波动值,从而根据质量波动值的大小来相应的调整整段音频数据的音量;具体为:获取每段音频数据的音量波动随时间变化的波形图,将音频波形图等距分为n段长度,获取每段长度内的波谷值Bmax以及波峰值Bmin,通过公式Xi=Bmax-Bmin求出每段长度的波频起伏值Xi;通过公式求出该段音频数据的响度值Loudness;获取每段长度内的波点个数Mi,通过公式求出该段音频数据的音调值Key;通过公式求出该段音频数据的质量波动值Y,α与β分别为各自的权重系数,YO为预设的标准阈值;当Y不为1时,则对该音频数据的音量值进行调整,其调整方法为:当Y>1时,表明音频音量过大,则可相应的将音频音量减少Y-1*1个音量;当Y<1时,表明音频音量过小,则可相应的将音频音量增加1-Y*2个音量;其中1、2为转化系数。

全文数据:

权利要求:

百度查询: 杭州全能数字科技有限公司 一种视讯系统的实时音频择路方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。