【发明授权】视频编辑方法及装置_支付宝(杭州)信息技术有限公司_202311594465.X

导航：龙图腾网> 最新专利技术> 视频编辑方法及装置_支付宝(杭州)信息技术有限公司_202311594465.X

申请/专利权人：支付宝(杭州)信息技术有限公司

申请日：2023-11-27

公开（公告）日：2024-03-19

公开（公告）号：CN117315056B

主分类号：G06T9/00

分类号：G06T9/00;H04N5/262;G06N3/0464;G06N3/045;G06N3/08;G06T5/70;G06T5/50

优先权：

专利状态码：有效-授权

法律状态：2024.03.19#授权;2024.01.16#实质审查的生效;2023.12.29#公开

摘要：本说明书实施例提供一种视频编辑方法及装置，其中视频编辑的实现基于预训练的文生图模型，所述文生图模型包括Unet模型。该方法包括：首先，确定与原始视频的n个视频帧对应的n个加噪编码，以及，确定与引导视频编辑的描述文本对应的文本编码。然后，利用文本编码和Unet模型对n个加噪编码分别进行去噪处理，得到n个去噪编码；其中Unet模型包括接续在目标网络层之后的自注意力层，对任意第i个加噪编码进行的去噪处理包括：在Unet模型的自注意力层中，基于目标网络层针对第i个加噪编码的输出，以及目标网络层针对预定的目标加噪编码的输出进行注意力计算。之后，分别对n个去噪编码进行解码处理，得到n个目标图像，用于形成编辑后的目标视频。

主权项：1.一种视频编辑方法，其实现基于预训练的文生图模型，所述文生图模型包括Unet模型，所述方法包括：确定与原始视频的n个视频帧对应的n个加噪编码，以及，确定与引导视频编辑的描述文本对应的文本编码；利用所述文本编码和复制所述Unet模型而得到的n个Unet模型，对所述n个加噪编码进行去噪处理，得到n个去噪编码；其中各Unet模型包括接续在目标网络层之后的自注意力层，所述去噪处理包括：在任意第i个Unet模型的自注意力层中，基于第i个Unet模型的目标网络层的输出，以及预定的目标Unet模型中目标网络层的输出进行注意力计算；所述目标Unet模型为预定的第j个Unet模型；分别对所述n个去噪编码进行解码处理，得到n个目标图像，用于形成编辑后的目标视频。

全文数据：

权利要求：

百度查询：支付宝(杭州)信息技术有限公司视频编辑方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

下一篇：一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

相关技术

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

管带纠偏装置_武汉巨沣工程技术有限公司_202322765867.3

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

龙图腾网&IPTOP

【发明授权】视频编辑方法及装置_支付宝(杭州)信息技术有限公司_202311594465.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务