【发明公布】基于唇动人脸生成技术的带表情说话人脸图像生成方法_杭州电子科技大学_202311523306.0

申请/专利权人：杭州电子科技大学

申请日：2023-11-15

公开（公告）日：2024-04-19

公开（公告）号：CN117912067A

主分类号：G06V40/16

分类号：G06V40/16;G06V20/40;G06V10/82;G06N3/0464;G06N3/0475;G06N3/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.07#实质审查的生效;2024.04.19#公开

摘要：本发明公开了基于唇动人脸生成技术的带表情说话人脸图像生成方法，包括如下步骤：S1、获取原视频，指定语言的单说话人视频，基于该原视频，得到翻译成另一种指定语言的人声音频和不带表情的图片序列；S2、基于另一种指定语言的人声音频，得到人声特征向量；S3、基于不带表情的图片序列，得到人脸特征向量；S4、基于预先给定的原视频人脸真实表情标注，得到人脸表情信息特征向量；S5、基于人声、人脸、表情信息特征向量，得到初始生成人脸；S6、将初始生成人脸通过鉴别器，获得自然带表情说话人脸图像序列。该方法通过引入一个额外的用于生成人脸表情的表情标签编码器、一个用于计算表情同步损失的预训练表情鉴别器，使其带有自然的面部表情。

主权项：1.一种基于唇动人脸生成技术的带表情说话人脸图像生成方法，其特征在于，包括如下步骤：S1、获取原视频，指定语言的但说话人视频，将原视频中的音频翻译成另一种指定语言的人声音频并得到不带表情的图片序列；S2、另一种指定语言的人声音频作为输入，通过非监督的语言表征训练算法Wav2Vec得到人声特征向量；S3、对于不带表情的图片序列F^*，每次取出当前帧F_i^*，与原视频时间对应的上一帧F_i-1拼接，拼接后作为输入通过FaceNet模型得到人脸特征向量；S4、给定人脸视频真实表情标签，通过表情标签编码器编码得到人脸表情标签；S5、将人声特征向量、人脸特征向量和人脸表情标签通过拼接并通过生成器得到初始生成人脸；S6、将初始生成人脸通过鉴别器，获得自然带表情说话人脸图像序列。

全文数据：

权利要求：

百度查询：杭州电子科技大学基于唇动人脸生成技术的带表情说话人脸图像生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种汽车配件的外圆磨削装置_江苏坦途专用汽车制造有限公司_202410150674.3

下一篇：一种设备锁定方法、装置及电子设备_联想(北京)有限公司_202410116925.6

相关技术

一种汽车配件的外圆磨削装置_江苏坦途专用汽车制造有限公司_202410150674.3

一种设备锁定方法、装置及电子设备_联想(北京)有限公司_202410116925.6

一种物品投递方法、装置、设备及介质和物品投递系统_何永安_202410173109.9

一种可移动车载伸缩无人机起降机场_齐鲁理工学院_202410345681.9

全氟异丁腈的合成方法_天津市长芦化工新材料有限公司_202410424719.1

一种电能表故障数据监测系统及数据存储介质_中电装备山东电子有限公司_202410411878.8

用于超声速进发直连风洞试验的发动机台架及设计方法_中国空气动力研究与发展中心高速空气动力研究所_202410420425.1

一种燃料电池用喷雾汽化加湿装置、系统与控制方法_武汉理工大学_202311803784.7

网站类别的识别方法及装置、设备、存储介质_中国移动通信集团有限公司_202311640121.8

一种中心静脉压手动测量装置_中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)_202410152192.1

一种异性粘结磁粉制备用原料筛选设备_天长市中德电子有限公司_202410411084.1

一种双频段相控阵雷达智能抗干扰方法_成都金武科技有限公司_202410410853.6

龙图腾网&IPTOP

【发明公布】基于唇动人脸生成技术的带表情说话人脸图像生成方法_杭州电子科技大学_202311523306.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务