2021
05-02
05-02
基础语音识别-食物语音识别baseline(CNN)
MFCC梅尔倒谱系数(Mel-scaleFrequencyCepstralCoefficients,简称MFCC)。MFCC通常有以下之过程:将一段语音信号分解为多个讯框。将语音信号预强化,通过一个高通滤波器。进行傅立叶变换,将信号变换至频域。将每个讯框获得的频谱通过梅尔滤波器(三角重叠窗口),得到梅尔刻度。在每个梅尔刻度上提取对数能量。对上面获得的结果进行离散傅里叶反变换,变换到倒频谱域。MFCC就是这个倒频谱图的幅度(am...
继续阅读 >