Python网络数据采集

图灵程序设计丛书

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
7.7311 评价豆瓣读书
阅读
  • 导言
  • 目录
  • 作品信息

本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。

Ryan Mitchell

数据科学家、软件工程师,目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前,曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有Instant Web Scraping with Java。

  1. 版权声明
  2. O'Reilly Media, Inc. 介绍
  3. 业界评论
  4. 译者序
  5. 前言
  6. 第一部分 创建爬虫
  7. 第 1 章 初见网络爬虫
  8. 第 2 章 复杂 HTML 解析
  9. 第 3 章 开始采集
  10. 第 4 章 使用 API
  11. 第 5 章 存储数据
  12. 第 6 章 读取文档
  13. 第二部分 高级数据采集
  14. 第 7 章 数据清洗
  15. 第 8 章 自然语言处理
  16. 第 9 章 穿越网页表单与登录窗口进行采集
  17. 第 10 章 采集 JavaScript
  18. 第 11 章 图像识别与文字处理
  19. 第 12 章 避开采集陷阱
  20. 第 13 章 用爬虫测试网站
  21. 第 14 章 远程采集
  22. 附录 A Python 简介
  23. 附录 B 互联网简介
  24. 附录 C 网络数据采集的法律与道德约束
  25. 作者简介
  26. 封面介绍
  27. 看完了

作者〔美〕Ryan Mitchell

译者陶俊杰陈小莉

类别 图书 / 非虚构

出版社人民邮电出版社

出版日期

ISBN9787115416292

提供方图灵社区

标签计算机(1722)编程(523)图灵程序设计丛书(14)数据挖掘(35)数据(72)Python(48)爬虫(2)

喜欢这本书的人也喜欢

评论

载入中