申请/专利权人:东南大学
申请日:2020-12-16
公开(公告)日:2024-04-02
公开(公告)号:CN112669819B
主分类号:G10L15/02
分类号:G10L15/02;G10L25/27;G10L25/45
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2021.05.04#实质审查的生效;2021.04.16#公开
摘要:本发明公开了基于不重叠分帧和串行FFT的极低功耗语音特征提取电路,属于计算、推算或计数的技术领域。该电路面向智能领域,通过优化MFCC算法架构,整体由预加重模块、加窗模块、傅里叶变换模块、梅尔滤波模块、相邻帧合并模块以及离散余弦变换等模块组成,使用不重叠分帧的方式避免了分帧时造成的大规模存储,将MFCC算法中包含的存储进一步削减,极大地降低了电路面积和功耗。该特征提取电路中的FFT算法采用串行流水线方式处理数据,充分利用音频数据串行流入的特点,进一步减小了电路的存储面积和运算次数。
主权项:1.基于不重叠分帧和串行FFT的极低功耗语音特征提取电路,其特征在于,包括:预处理模块,对串行输入的语音序列进行预加重处理,加窗模块,将t毫秒数据作为一个窗口的数据长度对预加重处理后的数据进行加窗操作,逐帧输出包含T个数据点的数据流,T=2N,N为正整数,FFT模块,对加窗操作后的数据逐层进行傅里叶变换后输出比特置换的复数数据,梅尔滤波模块,对FFT模块输出数据的能量值进行奇偶分离处理,对奇数时间索引或偶数时间索引的能量值进行多阶梅尔滤波得到当前帧的多阶梅尔值,相邻帧合并模块,累加当前帧的多阶梅尔值与前一帧的多阶梅尔值,输出更新后的当前帧多阶梅尔值,及,对数和DCT模块,对更新后的当前帧多阶梅尔值进行取对数操作和DCT变换,输出压缩表示的语音特征值;所述梅尔滤波模块包括:模式选择器,其输入端接FFT模块输出的复数数据,输出奇数时间索引或偶数时间索引的能量值,奇数时间点的多阶梅尔滤波模块,其输入端接奇数时间索引的能量值,读取奇数时间索引梅尔值的部分和,当前奇数时间点的能量值与梅尔系数相乘后累加读取的部分和得到当前帧的多阶梅尔值,及,偶数时间点的多阶梅尔滤波模块,其输入端接偶数时间索引的能量值,读取偶数时间索引梅尔值的部分和,当前偶数时间点的能量值与梅尔系数相乘后累加读取的部分和得到当前帧的多阶梅尔值。
全文数据:
权利要求:
百度查询: 东南大学 基于不重叠分帧和串行FFT的极低功耗语音特征提取电路
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。