恭喜浙江大学黄家伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江大学申请的专利一种快速语音驱动的面部视频编辑与生成方法、系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119785270B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510260392.3,技术领域涉及:G06V20/40;该发明授权一种快速语音驱动的面部视频编辑与生成方法、系统是由黄家伟;赵洲设计研发完成,并于2025-03-06向国家知识产权局提交的专利申请。
本一种快速语音驱动的面部视频编辑与生成方法、系统在说明书摘要公布了:本发明公开了一种快速语音驱动的面部视频编辑与生成方法、系统,属于面部生成技术领域。获取面部视频数据、面部表情文本描述和视频语音并提取特征,对视频特征进行随机时间段掩码遮挡后生成加噪视频特征,训练一个教师整流模型,其能够生成用于对加噪视频特征逐渐去噪的逆采样方向向量;再利用教师整流模型回流训练一个学生整流模型,利用训练后的学生整流模型对给定的面部图像进行视频生成,或者对给定的面部视频进行编辑。学生整流模型是在时间步为0时的加噪视频特征与教师整流模型产生的生成特征组成的配对基础上进行回流训练后得到的,提高了学生模型常微分方程轨迹的直线程度,能够用低生成步数快速实现高质量的面部视频生成与编辑。
本发明授权一种快速语音驱动的面部视频编辑与生成方法、系统在权利要求书中公布了:1.一种快速语音驱动的面部视频编辑与生成方法,其特征在于,包括:获取面部视频数据、面部表情文本描述和视频语音,分别提取视频特征、文本特征和语音特征作为特征数据集;对特征数据集中的视频特征与高斯噪声进行随机时间段掩码遮挡后生成加噪视频特征,利用加噪视频特征、文本特征和语音特征训练一个教师整流模型,所述教师整流模型能够生成用于对加噪视频特征逐渐去噪的逆采样方向向量;利用特征数据集训练一个学生整流模型,在每一个训练批次下,执行:由教师整流模型生成针对加噪视频特征的逆采样方向向量,并基于逆采样方向向量进行常微分方程的逆采样过程,对加噪视频特征去噪生成干净视频特征;将干净视频特征及其对应的时间步为0时的加噪视频特征作为特征样本对,重新生成基于随机时间步的加噪视频特征;学生整流模型根据特征样本对和重新生成的加噪视频特征,运行整流学习目标进行训练;利用训练后的学生整流模型对给定的面部图像进行视频生成,或者对给定的面部视频进行编辑。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。