智能语音处理
本书从智能化社会对语音处理提出的新要求出发,系统地介绍了智能语音处理涉及的基础理论、基本技术、主要方法以及典型的智能语音处理应用,理论与实际紧密结合,适合作为高等院校人工智能、电子信息工程、物联网工程、数据科学与大数据技术、通信工程等专业高年级本科生以及智能科学与技术、信号与信息处理、网络空间安全、通信与信息系统等学科研究生的参考教材,也可供从事语音处理技术研究与应用的科研及工程技术人员参考。
本书共11章,可分为四个部分。
第一部分是导论,对应第1章,概要介绍了经典语音处理与智能语音处理的基本概念以及语音处理的典型应用。
第二部分是基础理论,包括第2~5章。第2章介绍了稀疏和稀疏表示、冗余字典以及压缩感知的基本原理和方法;第3章介绍了隐变量模型,包括高斯混合模型、隐马尔可夫模型和高斯过程隐变量模型等;第4章主要介绍主成分分析和非负矩阵分解两种典型的组合模型;第5章主要介绍人工神经网络和深度学习的基础知识以及深度神经网络的典型结构。
第三部分是应用实践,包括第6~10章。第6章综合利用稀疏表示、字典学习、深度学习等智能处理技术,分别介绍基于K-L展开的字典学习的语音压缩感知、基于梅尔倒谱系数重构的抗噪低速率语音编码以及基于深度自编码器的抗噪低速率语音编码这三种方案;第7章重点介绍了基于非负矩阵分解和基于深度学习的智能语音增强方法;第8章在介绍语音转换的基本原理的基础上,重点介绍了基于非负矩阵分解和基于深度神经网络的谱转换方法;第9章首先介绍了说话人识别系统的框架和模型,然后分别介绍了基于i-vector和基于深度神经网络的说话人识别方法;第10章在介绍骨导语音特性和骨导语音盲增强的基本原理的基础上,分别介绍了基于长短时记忆网络和基于均衡-生成组合谱映射的骨导语音盲增强方法。
第四部分是结束语,对应第11章,对全书进行了总结,并对智能语音处理的未来发展进行展望。
本书共11章,可分为四个部分。
第一部分是导论,对应第1章,概要介绍了经典语音处理与智能语音处理的基本概念以及语音处理的典型应用。
第二部分是基础理论,包括第2~5章。第2章介绍了稀疏和稀疏表示、冗余字典以及压缩感知的基本原理和方法;第3章介绍了隐变量模型,包括高斯混合模型、隐马尔可夫模型和高斯过程隐变量模型等;第4章主要介绍主成分分析和非负矩阵分解两种典型的组合模型;第5章主要介绍人工神经网络和深度学习的基础知识以及深度神经网络的典型结构。
第三部分是应用实践,包括第6~10章。第6章综合利用稀疏表示、字典学习、深度学习等智能处理技术,分别介绍基于K-L展开的字典学习的语音压缩感知、基于梅尔倒谱系数重构的抗噪低速率语音编码以及基于深度自编码器的抗噪低速率语音编码这三种方案;第7章重点介绍了基于非负矩阵分解和基于深度学习的智能语音增强方法;第8章在介绍语音转换的基本原理的基础上,重点介绍了基于非负矩阵分解和基于深度神经网络的谱转换方法;第9章首先介绍了说话人识别系统的框架和模型,然后分别介绍了基于i-vector和基于深度神经网络的说话人识别方法;第10章在介绍骨导语音特性和骨导语音盲增强的基本原理的基础上,分别介绍了基于长短时记忆网络和基于均衡-生成组合谱映射的骨导语音盲增强方法。
第四部分是结束语,对应第11章,对全书进行了总结,并对智能语音处理的未来发展进行展望。
本书共11章,可分为四个部分。
第一部分是导论,对应第1章,概要介绍了经典语音处理与智能语音处理的基本概念以及语音处理的典型应用。
第二部分是基础理论,包括第2~5章。第2章介绍了稀疏和稀疏表示、冗余字典以及压缩感知的基本原理和方法;第3章介绍了隐变量模型,包括高斯混合模型、隐马尔可夫模型和高斯过程隐变量模型等;第4章主要介绍主成分分析和非负矩阵分解两种典型的组合模型;第5章主要介绍人工神经网络和深度学习的基础知识以及深度神经网络的典型结构。
第三部分是应用实践,包括第6~10章。第6章综合利用稀疏表示、字典学习、深度学习等智能处理技术,分别介绍基于K-L展开的字典学习的语音压缩感知、基于梅尔倒谱系数重构的抗噪低速率语音编码以及基于深度自编码器的抗噪低速率语音编码这三种方案;第7章重点介绍了基于非负矩阵分解和基于深度学习的智能语音增强方法;第8章在介绍语音转换的基本原理的基础上,重点介绍了基于非负矩阵分解和基于深度神经网络的谱转换方法;第9章首先介绍了说话人识别系统的框架和模型,然后分别介绍了基于i-vector和基于深度神经网络的说话人识别方法;第10章在介绍骨导语音特性和骨导语音盲增强的基本原理的基础上,分别介绍了基于长短时记忆网络和基于均衡-生成组合谱映射的骨导语音盲增强方法。
第四部分是结束语,对应第11章,对全书进行了总结,并对智能语音处理的未来发展进行展望。
本书共11章,可分为四个部分。
第一部分是导论,对应第1章,概要介绍了经典语音处理与智能语音处理的基本概念以及语音处理的典型应用。
第二部分是基础理论,包括第2~5章。第2章介绍了稀疏和稀疏表示、冗余字典以及压缩感知的基本原理和方法;第3章介绍了隐变量模型,包括高斯混合模型、隐马尔可夫模型和高斯过程隐变量模型等;第4章主要介绍主成分分析和非负矩阵分解两种典型的组合模型;第5章主要介绍人工神经网络和深度学习的基础知识以及深度神经网络的典型结构。
第三部分是应用实践,包括第6~10章。第6章综合利用稀疏表示、字典学习、深度学习等智能处理技术,分别介绍基于K-L展开的字典学习的语音压缩感知、基于梅尔倒谱系数重构的抗噪低速率语音编码以及基于深度自编码器的抗噪低速率语音编码这三种方案;第7章重点介绍了基于非负矩阵分解和基于深度学习的智能语音增强方法;第8章在介绍语音转换的基本原理的基础上,重点介绍了基于非负矩阵分解和基于深度神经网络的谱转换方法;第9章首先介绍了说话人识别系统的框架和模型,然后分别介绍了基于i-vector和基于深度神经网络的说话人识别方法;第10章在介绍骨导语音特性和骨导语音盲增强的基本原理的基础上,分别介绍了基于长短时记忆网络和基于均衡-生成组合谱映射的骨导语音盲增强方法。
第四部分是结束语,对应第11章,对全书进行了总结,并对智能语音处理的未来发展进行展望。
比价列表价格走势
1人想要
公众号、微信群
缺书网
微信公众号
微信公众号
扫码进群
实时获取购书优惠
实时获取购书优惠