买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于音频分析的视频实时剪辑方法、装置及设备_武汉星巡智能科技有限公司_202310605621.1 

申请/专利权人:武汉星巡智能科技有限公司

申请日:2023-05-26

公开(公告)日:2024-03-12

公开(公告)号:CN116600166B

主分类号:H04N21/439

分类号:H04N21/439;H04N21/44;H04N21/8547;H04N21/472;G10L17/18

优先权:

专利状态码:有效-授权

法律状态:2024.03.12#授权;2023.09.01#实质审查的生效;2023.08.15#公开

摘要:本发明涉及图像处理技术领域,解决了现有技术中无法高效地、准确地基于音频分析进行智能化视频实时剪辑的问题,提供了一种基于音频分析的视频实时剪辑方法、装置、设备及存储介质。该方法包括:获取室内监控场景下的实时视频数据和对应的第一时间戳集合,并获取实时音频数据和对应的第二时间戳集合;对所述实时音频数据进行音频分析,提取出具有预设标签的多个目标音频数据和所述第二时间戳集合中与各所述目标音频数据对应的第三时间戳集合;获取各所述目标音频数据和第三时间戳集合,依据所述第一时间戳集合,对所述实时视频数据进行视频分析,输出剪辑后的视频。本发明基于音频分析结果,高效地、准确地完成了视频实时剪辑。

主权项:1.一种基于音频分析的视频实时剪辑方法,其特征在于,所述方法包括:S1:获取室内监控场景下的实时视频数据和对应的第一时间戳集合,并获取实时音频数据和对应的第二时间戳集合;S2:对所述实时音频数据进行音频分析,提取出具有预设标签的多个目标音频数据和所述第二时间戳集合中与各所述目标音频数据对应的第三时间戳集合;S3:获取各所述目标音频数据和第三时间戳集合,依据所述第一时间戳集合,对所述实时视频数据进行视频分析,输出剪辑后的视频;所述S2包括:S21:依据预设的时间间隔,提取出所述实时视频数据中的第一音频数据;S22:获取所述第一音频数据,对所述第一音频数据进行声纹提取,得出实时声纹特征信息;S23:获取所述实时声纹特征信息,将所述实时声纹特征信息与预设的标准声纹特征信息进行声纹匹配,输出匹配结果;S24:依据所述匹配结果,输出各所述目标音频数据和所述第三时间戳集合;所述S24包括:S241:若所述匹配结果为成功,则将所述第一音频数据作为目标音频数据提取出来,并提取所述目标音频数据对应的第三时间戳集合;S242:若所述匹配结果为失败,则提取出所述第一音频数据中的第二音频数据,将所述第二音频数据与下一时间间隔的第三音频数据进行组合,得出新的第一音频数据,其中,第二音频数据的时长与第三音频数据的时长之和等于第一音频数据的时长;S243:对所述新的第一音频数据重复步骤S22至S24,直至提取出所述目标音频数据和所述第三时间戳集合。

全文数据:

权利要求:

百度查询: 武汉星巡智能科技有限公司 基于音频分析的视频实时剪辑方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。