>本案例基于HMM-GMM模型对单音源语音进行识别,主要数据是7种英文单词的单音源语音,每种单词包括15个文件。我们采用的是峰值特征,后续将会尝试使用MFCCs特征提取方法提取更优的特征进行识别,注意:本案例中的特征提取手段对于多音源及连续语音识别不适用。
本案例主要包括以下内容:
1. 语音识别框架
1.1 特征提取
1.2 解码
2. 数据探索
2.1 语音文件包含的内容
2.2 音频波形的可视化
3. 特征提取
3.1 短时傅里叶变换STFT
3.2 提取峰值
4. GMM-HMM模型解码
5. 语音识别模型训练及预测
6. 总结