深度学习：语音识别技术实践

作者简介柳若边 1. 猎兔搜索团队核心成员，曾供职于中国万网、三星等多家业内知名公司，现任某教育培训机构专业讲师。猎兔搜索创立于2004年，专注于自然语言处理等人工智能领域的技术开发与实现。在北京和上海等地均有猎兔培训的学员，猎兔搜索出版的相关技术图书读者遍及全国各省（市、区）及海外华人圈。内容简介语音识别已经逐渐进入人们的日常生活。语音识别技术是涉及语言、计算机、数学等领域的交叉学科。本书介绍了包括C#、Perl、Python、Java在内的多种编程语言实践，开源语音识别工具包Kaldi的使用与代码分析，深度学习的开发环境搭建，卷积神经网络，以及语音识别中常见的语言模型——N元模型和依存模型等，让读者快速了解语音识别基础，掌握开发语音识别程序的算法。本书从语音识别的基础开始讲起，并辅以翔实的案例，既适合需要具体实现语音识别的程序员使用，也适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读。前言作为人工智能技术的重要组成部分，语音识别旨在研究计算机如何听懂人的讲话。来源于人工神经网络的深度学习促进了语音识别技术的发展。本书从使用开源的语音识别构建系统Kaldi开始讲起，引导读者亲自实现语音识别系统，使用了C#、Perl、Python、Java等多种编程工具。第1章介绍语音识别的基本原理和Kaldi的基本使用方法，以及使用Kaldi开发语音识别系统应用到的Linux shell脚本基础；第2章介绍使用C#开发语音识别系统；第3章介绍Perl语言开发基础；第4章介绍开发语音识别系统所需要的Python基础；第5章介绍使用Java开发语音识别系统；第6章介绍傅里叶变换、MFCC特征等常用的语音信号处理方法；第7章介绍基本的神经网络和深度学习方法及训练神经网络的反向传播方法；第8章介绍语音识别解码阶段用到的语言模型，以及语言模型工具包——KenLM。 …