【发明公布】一种基于扩散模型的音乐条件化舞蹈动画生成方法_江西师范大学_202410146031.1

导航：龙图腾网> 最新专利技术> 一种基于扩散模型的音乐条件化舞蹈动画生成方法_江西师范大学_202410146031.1

申请/专利权人：江西师范大学

申请日：2024-02-02

公开（公告）日：2024-03-15

公开（公告）号：CN117710533A

主分类号：G06T13/00

分类号：G06T13/00;G06N3/0464;G06N3/0455;G06F18/10;G06F18/25;H04N21/44;H04N21/81

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.02#实质审查的生效;2024.03.15#公开

摘要：本发明公开了一种基于扩散模型的音乐条件化舞蹈动画生成方法，获取数据集并构建符合数据集中舞蹈视频的文本提示，将舞蹈视频切分成音乐片段和视频片段，从视频片段中第一帧、最后一帧分别得到表演者图像、源舞蹈动画片段，对获取的文本提示、音乐片段和表演者图像进行编码得到不同潜在特征，对源舞蹈动画片段添加一定时间步长、符合标准正态分布的噪声，将得到的不同潜在特征对添加的噪声进行预测得到去噪后的目标舞蹈动画片段潜在空间特征，通过预训练VAE模型对目标舞蹈动画片段潜在空间特征进行解码得到目标舞蹈动画片段。本发明将根据用户给定的音乐、文本提示、表演者图像等先验条件直接生成风格化的舞蹈图像，使其具有更好的实用性和泛化性。

主权项：1.一种基于扩散模型的音乐条件化舞蹈动画生成方法，其特征在于，包括如下步骤：步骤S1：构建舞蹈动画生成模型包括预训练扩散模型、预训练模型Wav2CLIP、对比语言图像预训模型CLIP、预训练VAE模型和多模态控制网络；所述预训练VAE模型由一个图像编码器和一个图像解码器组成；所述多模态控制网络由多个零卷积层、一个特殊的全连接层、编码器部分和中间层部分组成；所述编码器部分由多条件编码器模块、第二个扩散模型编码器模块、第三个扩散模型编码器模块、第四个扩散模型编码器模块组成；所述对比语言图像预训模型CLIP由CLIP文本编码器和CLIP图像编码器构成；所述多条件编码器模块由条件归一化模块构成；步骤S2：获取数据集的舞蹈视频，并构建与舞蹈视频符合的文本提示；步骤S2.1：将数据集的舞蹈视频进行一定时长切分成固定时长的音乐片段和视频片段，同时将视频片段中第一帧、最后一帧分别作为表演者图像、源舞蹈动画片段；步骤S3：采用对比语言图像预训模型CLIP、预训练模型Wav2CLIP和预训练VAE模型对文本提示、音乐片段和表演者图像进行编码得到不同潜在特征；不同潜在特征包括文本提示的潜在特征、音频的潜在特征和表演者图像的潜在空间特征；步骤S4：将源舞蹈动画片段编码到潜在空间，得到源舞蹈动画片段潜在空间特征，并对源舞蹈动画片段潜在空间特征进行时间步长的随机加噪，通过文本提示的潜在特征、音频的潜在特征和表演者图像的潜在空间特征的控制对源舞蹈动画片段潜在空间特征添加的噪声进行预测，进一步得到去除预测噪声的目标舞蹈动画片段潜在空间特征；步骤S5：对去噪后的目标舞蹈动画片段潜在空间特征用预训练VAE模型的图像解码器进行解码得到目标舞蹈动画片段。

全文数据：

权利要求：

百度查询：江西师范大学一种基于扩散模型的音乐条件化舞蹈动画生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种天然气管道不停输开孔装置_盐城新奥燃气有限公司_202322202238.X

下一篇：一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

相关技术

一种天然气管道不停输开孔装置_盐城新奥燃气有限公司_202322202238.X

一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

一种醋酸酐含量检测装置_山东嘉驰新材料股份有限公司_202322220520.0

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

整形压块及焊接装置_宁德时代新能源科技股份有限公司_202321970130.9

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

一种耐泥沙高密封性水泵控制阀_国电龙达电力设备(天津)有限责任公司_202322437322.X

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

龙图腾网&IPTOP

【发明公布】一种基于扩散模型的音乐条件化舞蹈动画生成方法_江西师范大学_202410146031.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务