Python社会媒体挖掘

Python社会媒体挖掘

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。

作品简介

本书共分为9章,从社会媒体API、数据挖掘技巧和Python的数据科学工具这3个主题进行阐释。主要内容包括:如何用Python通过公共API与社会媒体平台交互,如何以方便的格式为数据分析存储社会媒体数据,如何使用Python数据科学工具分割社会媒体数据,如何用文本分析方法理解社会媒体数据,如何用先进的统计和分析手段从海量数据中挖掘出有用信息,以及如何用Web技术来可视化数据。

马尔科·邦扎尼尼(Marco Bonzanini)

数据科学咨询师,拥有伦敦玛丽王后大学信息检索专业博士学位,是PyData伦敦meetup及系列会议的合作组织者,在很多国际会议上做过演讲,并且在PacktPub上教授“Python数据分析”和“实用Python数据科学技术”两门课程。他在个人博上分享了很多技术主题,主要关于Python、文本分析和数据科学。

作品目录

  1. 版权声明
  2. 前言
  3. 本书内容
  4. 本书需要的工具
  5. 目标读者
  6. 排版约定
  7. 读者反馈
  8. 客户支持
  9. 下载示例代码
  10. 下载本书中的彩色图片
  11. 勘误
  12. 反盗版
  13. 问题
  14. 电子书
  15. 第 1 章 社会媒体、社交数据和Python
  16. 1.1 入门
  17. 1.2 社会媒体——机遇和挑战
  18. 1.2.1 机遇
  19. 1.2.2 挑战
  20. 1.2.3 社会媒体挖掘技术
  21. 1.3 Python的数据科学工具
  22. 1.3.1 Python开发环境的安装
  23. 1.3.2 高效的数据分析
  24. 1.3.3 机器学习
  25. 1.3.4 自然语言处理
  26. 1.3.5 社会网络分析
  27. 1.3.6 数据可视化
  28. 1.4 Python中的数据处理
  29. 1.5 创建复杂的数据管道
  30. 1.6 小结
  31. 第 2 章 Twitter数据挖掘——标签、话题和时间序列
  32. 2.1 入门
  33. 2.2 Twitter API
  34. 2.2.1 接口访问频率限制
  35. 2.2.2 搜索与流
  36. 2.3 从Twitter收集数据
  37. 2.3.1 从时间线获取推文
  38. 2.3.2 推文的结构
  39. 2.3.3 使用流API
  40. 2.4 分析推文——实体分析
  41. 2.5 分析推文——文本分析
  42. 2.6 分析推文——时间序列分析
  43. 2.7 小结
  44. 第 3 章 Twitter用户、粉丝和社区
  45. 3.1 用户、好友和粉丝
  46. 3.1.1 回到Twitter API
  47. 3.1.2 用户资料的结构
  48. 3.1.3 下载好友和粉丝的资料
  49. 3.1.4 分析你的社会网络
  50. 3.1.5 度量影响力和参与度
  51. 3.2 挖掘粉丝
  52. 3.3 挖掘对话
  53. 3.4 在地图上绘制推文
  54. 3.4.1 将推文转换为GeoJSON
  55. 3.4.2 用Folium轻松绘制地图
  56. 3.5 小结
  57. 第 4 章 Facebook帖子、页面和用户互动
  58. 4.1 Facebook Graph API
  59. 4.1.1 注册你的应用
  60. 4.1.2 鉴权和安全
  61. 4.1.3 用Python连接Facebook Graph API
  62. 4.2 挖掘你的帖子
  63. 4.2.1 帖子的结构
  64. 4.2.2 时间频率分析
  65. 4.3 挖掘Facebook页面
  66. 4.3.1 从页面获取帖子
  67. 4.3.2 度量参与度
  68. 4.3.3 用词云可视化帖子
  69. 4.4 小结
  70. 第 5 章 Google+话题分析
  71. 5.1 Google+ API入门
  72. 在Google+中搜索
  73. 5.2 在Web GUI中嵌入搜索结果
  74. 5.2.1 Python的装饰器
  75. 5.2.2 Flask路由和模板
  76. 5.3 Google+页面的笔记和活动
  77. 5.4 笔记的文本分析和TF-IDF计算
  78. 用n-gram方法捕获短语
  79. 5.5 小结
  80. 第 6 章 Stack Exchange提问和回答
  81. 6.1 提问和回答
  82. 6.2 Stack Exchange API入门
  83. 6.2.1 搜索带标签的问题
  84. 6.2.2 搜索用户
  85. 6.3 处理Stack Exchange的存档数据
  86. 6.4 问题标签的文本分类
  87. 6.4.1 监督学习和文本分类
  88. 6.4.2 分类算法
  89. 6.4.3 评估
  90. 6.4.4 Stack Exchange数据的文本分类
  91. 6.4.5 在实时应用中嵌入分类器
  92. 6.5 小结
  93. 第 7 章 博客、RSS、维基百科和自然语言处理
  94. 7.1 博客和自然语言处理
  95. 7.2 从博客和网站获取数据
  96. 7.2.1 使用WordPress.com API
  97. 7.2.2 使用Blogger API
  98. 7.2.3 解析RSS和Atom订阅
  99. 7.2.4 从维基百科获取数据
  100. 7.2.5 关于网络爬取的一点建议
  101. 7.3 自然语言处理基础
  102. 7.3.1 文本处理
  103. 7.3.2 信息抽取
  104. 7.4 小结
  105. 第 8 章 挖掘所有数据
  106. 8.1 很多社交API
  107. 8.2 挖掘YouTube上的视频
  108. 8.3 挖掘GitHub上的开源软件
  109. 8.4 挖掘Yelp上的本地商家
  110. 8.5 创建自定义的Python客户端
  111. HTTP让事情变得简单
  112. 8.6 小结
  113. 第 9 章 关联数据和语义网
  114. 9.1 数据网
  115. 9.1.1 语义网词汇
  116. 9.1.2 微格式
  117. 9.1.3 关联数据和开放数据
  118. 9.1.4 RDF
  119. 9.1.5 JSON-LD格式
  120. 9.1.6 Schema.org
  121. 9.2 从DBpedia挖掘关系
  122. 9.3 挖掘地理坐标
  123. 9.3.1 从维基百科抽取地理数据
  124. 9.3.2 在Google Maps上绘制地理数据
  125. 9.4 小结
  126. 看完了