¥63.36
作品简介
这是一本深入浅出且极富趣味的深度学习入门书。本书选取深度学习近年来最重大的突破之一AlphaGo,将其背后的技术和原理娓娓道来,并配合一套基于BetaGo的开源代码,带领读者从零开始一步步实现自己的“AlphaGo”。本书侧重实践,深入浅出,庖丁解牛般地将深度学习和AlphaGo这样深奥的话题变得平易近人、触手可及,内容非常精彩。全书共分为3个部分:第一部分介绍机器学习和围棋的基础知识,并构建一个最简围棋机器人,作为后面章节内容的基础;第二部分分层次深入介绍AlphaGo背后的机器学习和深度学习技术,包括树搜索、神经网络、深度学习机器人和强化学习,以及强化学习的几个高级技巧,包括策略梯度、价值评估方法、演员-评价方法3类技术;第三部分将前面两部分准备好的知识集成到一起,并最终引导读者实现自己的AlphaGo,以及改进版AlphaGo Zero。读完本书之后,读者会对深度学习这个学科以及AlphaGo的技术细节有非常全面的了解,为进一步深入钻研AI理论、拓展AI应用打下良好基础。本书不要求读者对AI或围棋有任何了解,只需要了解基本的Python语法以及基础的线性代数和微积分知识。
马克斯·帕佩拉(Max Pumperla)就职于Skymind公司,是一名专职研究深度学习的数据科学家和工程师。他是深度学习平台Aetros的联合创始人。
凯文·费格森(Kevin Ferguson)在分布式系统和数据科学领域拥有18年的工作经验。他是Honor公司的数据科学家,曾就职于谷歌和Meebo等公司。
Max和Kevin是BetaGo的共同创造者。BetaGo是用Python开发的极少数开源围棋机器人之一。
作品目录
内容提要
战罢两奁分白黑,一枰何处有亏成(译者序)
序
前言
资源与支持
致谢
关于本书
关于作者
第一部分 基础知识
第1章 走近深度学习:机器学习入门
第2章 围棋与机器学习
第3章 实现第一个围棋机器人
第二部分 机器学习和游戏AI
第4章 使用树搜索下棋
第5章 神经网络入门
第6章 为围棋数据设计神经网络
第7章 从数据中学习:构建深度学习机器人
第8章 实地部署围棋机器人
第9章 通过实践学习:强化学习
第10章 基于策略梯度的强化学习
第11章 基于价值评估方法的强化学习
第12章 基于演员-评价方法的强化学习
第三部分 一加一大于二
第13章 AlphaGo:全部集结
第14章 AlphaGo Zero:将强化学习集成到树搜索中
附录A 数学基础
附录B 反向传播算法
附录C 围棋程序与围棋服务器
附录D 用AWS来训练和部署围棋程序与围棋服务器
附录E 将机器人发布到OGS
载入中