申请/专利权人:南斗六星系统集成有限公司
申请日:2020-07-31
公开(公告)日:2020-12-01
公开(公告)号:CN111741376B
主分类号:H04N21/81(20110101)
分类号:H04N21/81(20110101);H04N21/233(20110101);H04N21/234(20110101);G06F16/16(20190101);G06F16/40(20190101)
优先权:
专利状态码:有效-授权
法律状态:2020.12.01#授权;2020.10.30#实质审查的生效;2020.10.02#公开
摘要:一种多媒体文件拼接音视频唇音同步的方法,包括:获取待拼接的多媒体文件,确定待拼接的多媒体文件拼接顺序;获取待拼接的多媒体文件的基础信息,根据待拼接的多媒体文件的基础信息,创建目标多媒体文件;对当前待拼接多媒体文件顺序进行判断,对于不同拼接顺序和文件类型的多媒体文件,采用不同的预设规则进行处理,拼接到目标多媒体文件;当最后一个多媒体文件处理完成加入到目标多媒体文件后,对目标多媒体文件的文件头进行更新,对目标多媒体文件的文件尾进行重新写入。本发明逻辑简单,易实现,实用性强,效果好,可行性和可靠性高,适用范围广,适用于所有主流格式的文件拼接。
主权项:1.一种多媒体文件拼接音视频唇音同步的方法,其特征在于,包括:S100.获取待拼接的多媒体文件,确定待拼接的多媒体文件拼接顺序;S200.获取待拼接的多媒体文件的基础信息,根据待拼接的多媒体文件的基础信息,创建目标多媒体文件;S300.对当前待拼接多媒体文件顺序进行判断,若当前待拼接多媒体文件顺序不为最后一个文件时,对待拼接多媒体文件类型进行判定,根据不同多媒体文件类型,采用第一预设规则进行处理,将处理后的音视频数据加入到目标多媒体文件;多媒体文件类型包括:只有音频、只有视频和同时含有音视频;第一预设规则为:若待拼接多媒体文件同时包含音视频流,记录音视频帧的显示时间分别为T1、T2,完成对目标多媒体文件数据的写入后,比对音视频最后一帧的显示时间值,若当音频显示时间小于视频显示时间,且两者差值大于预设阈值时,写入音频静音包,直到两者显示时间的差值小于预设阈值,调整记录音频显示时间T1的值;当视频显示时间小于音频显示时间时,直接调整记录视频显示时间T2的值;第一预设规则还包括:若待拼接多媒体文件只含音频流,记录音频帧的显示时间T1,完成音频数据的写入后,创造一帧编码为I帧的黑色的视频数据,写入目标多媒体文件,调整记录视频帧的显示时间T2,使T2等于T1;第一预设规则还包括:若待拼接多媒体文件只含视频流,记录视频帧的显示时间T2,完成视频数据的写入后,持续造音频静音数据,编码后写入目标多媒体文件,新造的音频包按规律标注显示时间,待音频的显示时间T1与视频显示时间T2的差值小于预设阈值后,停止静音包填充;S400.对当前待拼接多媒体文件顺序进行判断,若当前待拼接多媒体文件顺序为最后一个文件时,采用第二预设规则进行处理,将处理后的音视频数据加入到目标多媒体文件;第二预设规则为:对最后一个多媒体文件进行编解码,根据前一待拼接多媒体文件音频的显示时间与视频显示时间,重新为编码生成的媒体数据赋值音视频时间戳;S500.当最后一个多媒体文件处理完成加入到目标多媒体文件后,对目标多媒体文件的文件头进行更新,对目标多媒体文件的文件尾进行重新写入。
全文数据:
权利要求:
百度查询: 南斗六星系统集成有限公司 一种多媒体文件拼接音视频唇音同步的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。