深度学习与计算机视觉

叶韵 编著
序言 深度学习是机器学习的一个重要分支,它以简化的方式模拟人脑复杂的神经系统,从而达到对数据的高级抽象。近些年,深度学习在语音识别、计算机视觉、自然语言处理、生成网络和无监督学习等领域都有着广泛的应用,从很多方面改变着人们的日常生活。 互联网巨头谷歌、Facebook、亚马逊、微软、百度、阿里巴巴和腾讯等公司都建立了相应的深度学习部门和平台。随着近几年深度学习的快速发展,相继出现了大量的开源软件平台,如Caffe、MXNet、TensorFlow和Torch等。这些平台多数都有相应的Python和C++接口,功能非常强大。但是对于初学者来说,还是有一定的门槛。 本书架起了一座初学者和开源深度学习软件之间的桥梁,致力于帮助初学者进入机器学习特别是深度学习在计算机视觉中的应用等领域。本书涵盖了基础的数学、机器学习和图像识别等内容,同时对两个主流的开源深度学习库Caffe和MXNet都有大量的实战例子描述分类和回归等问题。 本书作者在深度学习领域有着深入的研究,善于把复杂的问题用浅显易懂的语言描述出来,使得本书内容引人入胜。本书结构合理,内容涵盖了计算机视觉领域的一些主要问题。对于一个学习计算机视觉的新手来说,本书的数学推导浅显易懂,从一些简单例子开始,然后推广到抽象的矩阵描述方式,大大减轻了学习负担。读者可以通过前7章的学习,对神经网络、基础的数学和编程技巧有一个全面的了解。在此基础上可以根据具体的问题参考本书中具体的章节,例如图像识别、回归和目标检测等。在这些章节中,读者可以按照书中的步骤搭建自己的应用。 田疆 西门子高级研究员 附英文原文 Deep learning is a branch of machine learning based on a set of algorithms that attempt to model high level abstractio…