2021
07-22
07-22
详解Unity 实现语音识别功能
现在语音识别已经被广泛的应用到各个领域中,在Unity开发中,语音识别也非常受欢迎。大部分人都会选择科大讯飞的语音识别功能,但是在一些小的项目中,使用科大讯飞的就有点大材小用了。今天就介绍一下Unity自带的语音识别功能。说是语音识别,其实unity本身还是做不到的,Unity自带的语音识别功能其实是关键字识别。比如我在Unity中设定好一句话汇总的几个关键词。当我再说这句话的时候就会和识别到。经过测试发现当一句话中有八...
继续阅读 >
MFCC梅尔倒谱系数(Mel-scaleFrequencyCepstralCoefficients,简称MFCC)。MFCC通常有以下之过程:将一段语音信号分解为多个讯框。将语音信号预强化,通过一个高通滤波器。进行傅立叶变换,将信号变换至频域。将每个讯框获得的频谱通过梅尔滤波器(三角重叠窗口),得到梅尔刻度。在每个梅尔刻度上提取对数能量。对上面获得的结果进行离散傅里叶反变换,变换到倒频谱域。MFCC就是这个倒频谱图的幅度(am...
1.原理语音操控分为语音识别和语音朗读两部分。这两部分本来是需要自然语言处理技能相关知识以及一系列极其复杂的算法才能搞定,可是这篇文章将会跳过此处,如果你只是对算法和自然语言学感兴趣的话,就只有请您移步了,下面没有一个字会讲述到这些内容。早在上世纪90年代的时候,IBM就推出了一款极为强大的语音识别系统-viovoice,而其后相关产品层出不穷,不断的进化和演变着。我们这里将会使用SAPI实现语音模块。2.什么是S...