Python网络爬虫从入门到实践

唐松 陈智铨 编著
推荐序一 我们正处于飞速发展的大数据时代。不同于以往,现如今丰富的数据信息让我们有能力更好地了解消费者、顾客和竞争对手。通过电商网站评论收集可以及时知悉顾客对于产品的看法,通过微博数据收集可以及时洞察潜在消费者的购买意向和需求,通过对手网站信息收集可以及时知晓对手的实时动态,真正做到运筹帷幄之中,决胜千里之外。 本书就是帮助你打开数据信息收集大门的钥匙!本书从最基本的Python语言讲起,完整地介绍了爬虫程序的每一个知识模块,同时附有最新案例教大家如何利用学到的知识进行实操,让不了解Python语言的人也可以在短时间内掌握爬虫程序的编写,快速成长为爬虫高手。本书条理清晰、层次分明,实用性极强。 作者唐松是一名年轻有为、经验丰富的数据分析专家。他通过这本书和读者分享多年网络爬虫和数据挖掘的经验。这本书是IT人士、企业管理人员、市场营销人员和有志于在数据分析方面有所突破的人士值得一读的好书。 香港中文大学市场系教授 刘建南 2017年6月26日 推荐序二 “工欲善其事,必先利其器。” ───《论语·卫灵公》 读这本书需要考虑这样一个问题:到底是学习Python重要,还是掌握网络爬虫重要,抑或两者一样重要?对于这个问题的回答将直接影响读者最后能从这本书里学到什么。我来给大家一个简单的定义,网络爬虫是“事”,而Python是“器”,是用来进行网络爬虫的锋刃。在这个定义下,这一问题就转化成了究竟是“事”重要还是“器”重要。 如果你是管理者,那么这个答案就更接近于“事”。因为管理者在向所在的团队发号施令之前,要先思考你的想法到底能否和所在团队的技术优势相契合。近年来,我们眼见大数据以“迅雷不及掩耳之势”席卷全球,但这场旋风的背后是一个残酷的事实:很多公司在迈入大数据领域后遭遇“滑铁卢”。究其原因,管理层的惰性首当其冲。当管理层只知道在高尔夫球场对大数据高谈阔论时,我们又如何期冀技…