《VoIP语音处理与识别》作者:屈丹著

VoIP语音处理与识别

  • 内容简介:

      《VoIP语音处理与识别》从VoIP通信过程出发,以传统语音识别技术为基础,沿着PSTN网信号处理和IP包信号处理两个主线进行研究,以语音识别的前端处理、特征提取、模型建立、后端处理过程进行组织。针对VoIP语音识别系统实用化的问题,给出了一些改善语音识别系统性能的关键技术,力求使得VoIP语音识别能走出实验室,向实用发展。
      全书共14章,分为:绪论、VoIP语音编码标准、语音信号和话带数据检测、VoIP信道检测、语音信号的特征提取、编解码失配补偿、通话模式分析、VoIP协议分析及数据获取、丢包处理、码流特征提取、特征选择与特征变换、语音识别的模型、稳健性识别技术和语音识别应用。全书对VoIP语音处理识别技术进行了详尽的、深入浅出的讲解,并根据作者的研究与实验结果提供了大量的实际参数、图表,与实际工作联系紧密,具有很强的可操作性与实用性。章节之间紧密配合、前后呼应,具有很强的系统性。同时,通过书中的研究过程和研究方法,读者能够在以后的研究工作中受到很大的启发。
      《VoIP语音处理与识别》可作为高等院校理工科通信和信息处理及相关专业的高年级本科生和(硕士、博士)研究生的教材或参考书,也可供从事信息处理、通信工程等专业的研究人员参考。

  • 作者简介:

      屈丹,女,吉林九台人,1974年9月出生,博士,信息工程大学信息工程学院讲师。主要从事语音处理与识别、信息融合等前沿学科的教学与科研。主持国家“863”课题、军队重点科研项目,郑州市重点科技攻关项目等5项;作为主要技术负责人,参与国家自然科学基金项目、军队重点科研项目等10多项;获省部级科技进步二等奖3项,发表论文40余篇,其中10多篇次进入三大检索,公开出版著作3部。
      王波,男,江苏南京人,1978年1月出生,博士,信息工程大学信息工程学院讲师。主要从事语音处理与识别、网络协议分析等前沿学科的教学与科研。主持和参加了国家自然科学基金项目、国家“863”课题、国家社科基金项目、军队科研项目等10余项;获省部级科技进步二等奖2项;发表论文30余篇,其中15篇次进入三大检索;公开出版著作2部。
      李弼程,男,湖南衡南人.1970年7月出生,博士,留英学者.信息工程大学信息工程学院教授、博士生导师。主要从事文本分析与理解、语音处理与识别,图像/视频处理与识别、多源信息融合等前沿学科的教学与科研。主持国家自然科学基金项目、国家“863”课题、国家社科基金项目、军队科研项目等20余项;获省部级科技进步一等奖1项、二等奖2项、三等奖4项;发表论文200余篇.其中80多篇次进入三大检索;已公开出版著作5部。

  • 目录:

    第1章绪论
    1.1VoIP的基本概念和系统组成
    1.1.1VoIP基本概念
    1.1.2VoIP基本原理
    1.1.3VoIP系统基本组成
    1.1.4VoIP主要特点
    1.1.5VoIP的关键技术
    1.2语音识别的基本原理与研究内容
    1.2.1语音识别基本原理
    1.2.2传统语音识别
    1.2.3VoIP语音识别
    1.3传统语音识别的发展历程
    1.4VoIP语音识别的发展历程
    参考文献
    第2章VoIP语音编码标准
    2.1G.7ll语音编码
    2.1.1G.7ll语音编码原理
    2.1.2A律压缩
    2.1.3u律压缩
    2.2G.729语音编码
    2.2.1G.729编码原理
    2.2.2编码器实现技术
    2.2.3解码器功能说明
    2.3G.723.1语音编码
    2.3.1编码器原理
    2.3.2编码器实现技术
    2.3.3解码器原理
    2.3.4解码器实现技术
    参考文献
    第3章语音和话带数据检测
    3.1话带数据简介
    3.1.1传真
    3.1.2调制解调器数据
    3.1.3单音信号和双音多频信号(DTMF)
    3.2语音和话带数据波形的特点
    3.2.1语音波形的特点
    3.2.2话带数据信号波形的特点
    3.3语音和话带数据识别的特征分析
    3.3.1能量相关参数
    3.3.2过零率相关参数
    3.3.30~I一化自相关函数
    3.3.4基音周期
    3.3.5谱特征
    3.4语音和话带数据分离方法
    3.5语音与话带数据检测技术应用
    参考文献
    附录
    第4章VolP信道检测
    4.1声道参数
    4.2语音信号统计参数
    4.2.1偏度与峰度
    4.2.2LPC峰度及偏度
    4.2.3LPCC峰度及偏度
    4.3静态信噪比
    4.4非自然周期性参数
    4.4.1非自然嘟嘟声
    4.4.2机器性参数
    4.4.3帧重复性
    4.5哑声参数与中断参数
    4.5.1哑声参数
    4.5.2中断参数
    4.6基于支持矢量机的VolP信道检测方法
    4.6.1算法流程
    4.6.2支持矢量机
    4.6.3算法的具体实现
    参考文献
    第5章语音信号的特征提取
    5.1基音周期
    5.1.1基音检测的难点及方法分类
    5.1.2自相关法及其改进
    5.1.3并行处理法
    5.1.4倒谱法
    5.1.5简化逆滤波法
    5.2线性预测参数
    5.2.1线性预测信号模型
    5.2.2线性预测误差滤波
    5.2.3语音信号的线性预测分析
    5.2.4线性预测分析的解法
    5.2.5斜格法(LatticeMethod)及其改进
    5.3线谱对(LSP)参数
    5.3.1线谱对分析原理
    5.3.2线谱对分析的求解
    5.4倒谱系数及差分参数
    5.4.1LPCC参数
    5.4.2MFCC参数
    5.4.3ASCC参数
    5.4.4差分参数
    5.5感觉加权的线性预测(PUP)特征
    5.5.1PLP参数
    5.5.2RASTA-PI.P参数
    5.6高阶信号谱类特征
    5.6.1WV谱的定义及其主要性质
    5.6.2WV谱计算式的一些变形
    参考文献
    第6章编解码失配补偿
    6.1编解码失配影响
    6.1.1VoIP系统语音传输
    6.1.2编解码失配对说话人辨认系统的影响
    6.1.3编解码失配对说话人确认系统的影响
    6.1.4特征参数的编码失真
    6.2常用编解码失配补偿方法
    6.2.1失配补偿的基本思想
    6.2.2经验补偿技术
    6.2.3盲补偿
    6.2.4基于特征及模型的补偿
    6.3基于编码失真的加权GMM模型算法
    6.3.1加权GMM模型
    6.3.2权重矩阵C的确定
    6.3.3实验及分析
    6.4编码自动匹配方法
    6.4.1编码自动匹配方法的基本思想
    6.4.2语音编码检测器
    6.4.3实验及分析
    6.5统计匹配特征变换失配补偿算法
    6.5.1统计匹配的基本思想
    6.5.2线性特征变换式
    6.5.3非线性特征变换式
    ……
    第7章通话模式分析
    第8章VoIP协议分析及数据获取
    第9章丢包处理
    第10章码流特征提取
    第11章特征选择与特征变换
    第12章语音识别的模型
    第13章稳健性识别技术
    第14章语音识别应用
    参考文献


数据来源网络,发布时间为(2022-11-12 14:47:13)

0

站点公告

如需电子书试读,请工单留言!
没有账号?注册  忘记密码?