买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于共振峰的口型表情动画生成方法、装置及存储介质_上海幻维数码创意科技股份有限公司_202011618339.X 

申请/专利权人:上海幻维数码创意科技股份有限公司

申请日:2020-12-30

公开(公告)日:2024-03-26

公开(公告)号:CN112700520B

主分类号:G06T13/20

分类号:G06T13/20;G06T13/40;G10L19/032

优先权:

专利状态码:有效-授权

法律状态:2024.03.26#授权;2021.05.11#实质审查的生效;2021.04.23#公开

摘要:本发明涉及一种基于共振峰的口型表情动画生成方法、装置及存储介质,方法包括以下步骤:对音频信号进行分帧处理;进行快速傅里叶变换,得到每个语音帧的频谱,获取每个语音帧的共振峰数据;基于共振峰数据得到每个语音帧对应的控制字;替换控制序列中的奇异点,得到元音序列,基于元音序列,生成口型动画和表情动画。与现有技术相比,本发明基于共振峰数据,得到每个声音帧对应的元音,再通过替换奇异点,可以减少抖动,口型和表情的变化更加自然流畅,保证了视觉效果,提升了用户体验;每次自元音序列中读取多个控制字,将出现次数最多的控制字作为目标控制字,进一步抑制了因声音突变而造成的口型和表情突变。

主权项:1.一种基于共振峰的口型表情动画生成方法,其特征在于,包括以下步骤:S1:获取音频信号,对音频信号进行分帧处理,得到N个语音帧,N0;S2:对每个语音帧分别进行快速傅里叶变换,得到每个语音帧的频谱,基于频谱分别得到每个语音帧的共振峰数据;S3:基于共振峰数据,分别得到每个语音帧对应的控制字,N个语音帧的控制字组成了控制序列{k1、k2、…、kN},每一个控制字ki对应一个元音,1≤i≤N;S4:遍历控制序列,替换控制序列中的所有奇异点,得到元音序列,具体为:对于控制序列中的控制字ks,2≤s≤N-2,如果ks≠ks-1,且ks-1=ks+1=ks+2,则控制字ks为奇异点,将ks的值替换为ks-1;S5:基于元音序列,生成口型动画和表情动画;所述步骤S2中基于频谱分别得到每个语音帧的共振峰数据具体为:获取每个语音帧的前3个共振峰F1、F2、F3;所述步骤S5具体为:根据预设置的读取速度,每次自元音序列中读取q个控制字,q0,取q个控制字中出现次数最多的控制字为目标控制字,获取目标控制字对应的目标元音,获取目标元音对应的目标口型和目标表情,生成目标口型动画和目标表情动画;所述读取速度为10次s,q的取值为10,即每秒读取10次,每次自元音序列中读取10个控制字。

全文数据:

权利要求:

百度查询: 上海幻维数码创意科技股份有限公司 基于共振峰的口型表情动画生成方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。