第1章 语音信号处理概述
1.1 语音基础知识
1.1.1 语音的声学特性
1.1.2 语音的基本单元
1.2 英语口音处理
1.2.1 英语口音概述
1.2.2 英语口音的研究现状
1.3 语音识别
1.3.1 语音识别的基本原理
1.3.2 鲁棒语音识别
1.4 语音信号处理的其他应用
1.4.1 语音增强
1.4.2 语音编码
1.4.3 语音合成
参考文献
第2章 语音信号模型及声学特征
2.1 基本模型
2.1.1 源一滤波器模型
2.1.2 线性预测模型
2.2 贝叶斯模型
2.2.1 贝叶斯估计
2.2.2 隐马尔可夫模型
2.2.3 语言模型
2.3 语音的声学特征
2.3.1 共振峰
2.3.2 美尔频率倒谱系数
2.3.3 语调与语速
参考文献
第3章 鲁裤语音识别的基本方法
3.1 特征域方法
3.1.1 倒谱均值正规化
3.1.2 相对谱
3.1.3 双通道分段线性环境补偿
3.1.4 矢量泰勒级数
3.2 模型域方法
3.2.1 最大后验自适应
3.2.2 最大似然线性回归
3.2.3 并行模型组合
3.3 本章小结
参考文献
第4章 英语口音的声学差异
4.1 英语口音的演化与分布
4.1.1 英语口音的演化
4.1.2 口音的语音学差异
4.2 英语口音的语音学特点
4.2.1 英式标注英语和美式标注英语的比较概述
4.2.2 澳大利亚发音特点
4.3 英语口音的声学特点
4.3.1 共振峰特征
4.3.2 语调、时长及语速特征
4.3.3 英语口音对语音识别的影响
4.4 本章小结
参考文献
第5章 英语口音的声学分析
5.1 共振峰及共振峰轨迹的概率模型
5.1.1 共振峰概率模型
5.1.2 基于二维隐马尔可夫模型的共振峰估计及轨迹估
5.2 英语口音的共振峰特征分析
5.2.1 英式发音、澳式发音和美式发音的共振峰比较
5.2.2 基于口音的共振峰排序
5.3 英语口音的韵律分析
5.3.1 英语口音的语调模型分析
5.3.2 音素的音长和语速分析
5.4 本章小结
参考文献
第6章 英语口音转换
6.1 口音转换概述
6.2 共振峰转换
6.2.1 非均匀线性LP频谱弯折
6.2.2 共振峰曲线映射
6.3 语调转换
6.3.1 时域基音同步叠加
6.3.2 语调特征映射方法
6.4 口音转换
6.4.1 并行口音转换
6.4.2 实验结果与分析
6.5 本章小结
参考文献
第7章 基于共振峰曲线和谐波噪声模型的语音增强
7.1 引言
7.2 噪声环境下共振峰曲线提取
7.2.1 噪声对共振峰估计的影响
7.2.2 基于状态相依卡尔曼滤波器组的共振峰轨迹平滑
7.2.3 性能评估
7.3 谐波噪声模型
7.3.1 基音频率估计
7.3.2 谐波幅值与噪声估计
7.4 语音增强
7.4.1 基于共振峰曲线和谐波噪声模型的语音增强算法
7.4.2 实验与分析
7.5 本章小结
参考文献
第8章 基于特征神偿的鲁棒语音识别
8.1 基于隐马尔可夫模型的模型组合
8.1.1 语音模型
8.1.2 含噪语音模型参数的并行模型组合估计
8.1.3 纯净语音特征矢量的最小均方误差估计
8.1.4 状态转移概率矩阵的压缩
8.2 基于矢量泰勒级数的自适应特征补偿
8.2.1 基于VTS的特征补偿算法
8.2.2 基于HMM的特征补偿
8.3 实验结果及分析
8.3.1 模型组合实验及分析
8.3.2 自适应特征补偿实验及分析
8.4 本章小结
参考文献
第9章 基于矢量素勒级数的多环境模型自适应算法
9.1 基于VTS的模型自适应
9.1.1 静态参数调整
9.1.2 动态参数调整
9.2 多环境模型
9.3 基于含噪训练语音的VTS关系式
9.4 测试噪声参数的最大似然估计
9.4.1 噪声均值估计
9.4.2 噪声方差估计
9.5 实验结果及分析
9.5.1 实验条件
9.5.2 测试噪声与训练噪声的功率谱特性比较
9.5.3 自适应过程的收敛特性
9.5.4 多环境自适应结果及讨论
9.6 本章小结
参考文献
第10章 基于多项式回归的模型自适应算法
10.1 基于多项式回归的模型自适应
10.1.1 均值矢量的多项式回归
10.1.2 多项式系数的最大似然估计
10.2 基于子带多项式回归的模型自适应
10.2.1 均值矢量的子带多项式回归
10.2.2 子带多项式系数的最大似然估计
10.3 实验结果及分析
10.3.1 多项式回归实验
10.3.2 子带回归实验
10.4 本章小结
参考文献
展开