从零开始学Python数据分析与挖掘

从零开始学Python数据分析与挖掘

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
7.617 评价豆瓣读书
¥47.40¥32.99
今日特价截止至:2024-06-17 02:00:00了解详情

作品简介

本书以Python3版本作为数据分析与挖掘实战的应用工具,从Pyhton的基础语法开始,陆续介绍有关数值计算的Numpy、数据处理的Pandas、数据可视化的Matplotlib和数据挖掘的Sklearn等内容。全书共涵盖15种可视化图形以及10个常用的数据挖掘算法和实战项目,通过本书的学习,读者可以掌握数据分析与挖掘的理论知识和实战技能。

本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。

刘顺祥,统计学硕士,“数据分析1480”微信公众号运营者。曾就职于大数据咨询公司,为联想、亨氏、美丽田园、网鱼网咖等企业项目提供服务;曾在唯品会大数据部担任数据分析师一职,负责电商支付环节的数据分析业务。

作品目录

  1. 作者简介
  2. 内容简介
  3. 前言
  4. 第1章 数据分析与挖掘概述
  5. 1.1 什么是数据分析和挖掘
  6. 1.2 数据分析与挖掘的应用领域
  7. 1.3 数据分析与挖掘的区别
  8. 1.4 数据挖掘的流程
  9. 1.5 常用的数据分析与挖掘工具
  10. 1.6 本章小结
  11. 第2章 从收入的预测分析开始
  12. 2.1 下载与安装Anoconda
  13. 2.2 基于Python的案例实战
  14. 2.3 本章小结
  15. 第3章 Python快速入门
  16. 3.1 数据结构及方法
  17. 3.2 控制流
  18. 3.3 字符串处理方法
  19. 3.4 自定义函数
  20. 3.5 一个爬虫案例
  21. 3.6 本章小结
  22. 第4章 Python数值计算工具——Numpy
  23. 4.1 数组的创建与操作
  24. 4.2 数组的基本运算符
  25. 4.3 常用的数学和统计函数
  26. 4.4 线性代数的相关计算
  27. 4.5 伪随机数的生成
  28. 4.6 本章小结
  29. 第5章 Python数据处理工具——Pandas
  30. 5.1 序列与数据框的构造
  31. 5.2 外部数据的读取
  32. 5.3 数据类型转换及描述统计
  33. 5.4 字符与日期数据的处理
  34. 5.5 常用的数据清洗方法
  35. 5.6 数据子集的获取
  36. 5.7 透视表功能
  37. 5.8 表之间的合并与连接
  38. 5.9 分组聚合操作
  39. 5.10 本章小结
  40. 第6章 Python数据可视化
  41. 6.1 离散型变量的可视化
  42. 6.2 数值型变量的可视化
  43. 6.3 关系型数据的可视化
  44. 6.4 多个图形的合并
  45. 6.5 本章小结
  46. 第7章 线性回归预测模型
  47. 7.1 一元线性回归模型
  48. 7.2 多元线性回归模型
  49. 7.3 回归模型的假设检验
  50. 7.4 回归模型的诊断
  51. 7.5 本章小结
  52. 第8章 岭回归与LASSO回归模型
  53. 8.1 岭回归模型
  54. 8.2 岭回归模型的应用
  55. 8.3 LASSO回归模型
  56. 8.4 LASSO回归模型的应用
  57. 8.5 本章小结
  58. 第9章 Logistic回归分类模型
  59. 9.1 Logistic模型的构建
  60. 9.2 分类模型的评估方法
  61. 9.3 Logistic回归模型的应用
  62. 9.4 本章小结
  63. 第10章 决策树与随机森林
  64. 10.1 节点字段的选择
  65. 10.2 决策树的剪枝
  66. 10.3 随机森林
  67. 10.4 决策树与随机森林的应用
  68. 10.5 本章小结
  69. 第11章 KNN模型的应用
  70. 11.1 KNN算法的思想
  71. 11.2 最佳k值的选择
  72. 11.3 相似度的度量方法
  73. 11.4 近邻样本的搜寻方法
  74. 11.5 KNN模型的应用
  75. 11.6 本章小结
  76. 第12章 朴素贝叶斯模型
  77. 12.1 朴素贝叶斯理论基础
  78. 12.2 几种贝叶斯模型
  79. 12.3 本章小结
  80. 第13章 SVM模型的应用
  81. 13.1 SVM简介
  82. 13.2 几种常见的SVM模型
  83. 13.3 分类问题的解决
  84. 13.4 预测问题的解决
  85. 13.5 本章小结
  86. 第14章 GBDT模型的应用
  87. 14.1 提升树算法
  88. 14.2 梯度提升树算法
  89. 14.3 非平衡数据的处理
  90. 14.4 XGBoost算法
  91. 14.5 本章小结
  92. 第15章 Kmeans聚类分析
  93. 15.1 Kmeans聚类
  94. 15.2 最佳k值的确定
  95. 15.3 Kmeans聚类的应用
  96. 15.4 Kmeans聚类的注意事项
  97. 15.5 本章小结
  98. 第16章 DBSCAN与层次聚类分析
  99. 16.1 密度聚类简介
  100. 16.2 密度聚类与Kmeans的比较
  101. 16.3 层次聚类
  102. 16.4 密度聚类与层次聚类的应用
  103. 16.5 本章小结
载入中