Python数据分析与挖掘实战

Python数据分析与挖掘实战

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
7.8114 评价豆瓣读书
免费试读

作品简介

本书从实践出发,结合大量数据挖掘工程案例及教学经验,以真实案例为主线,深入浅出地介绍数据挖掘建模过程中的有关任务:数据探索、数据预处理、分类与预测、聚类分析、时序预测、关联规则挖掘、智能推荐和偏差检测等。因此,图书的编排以解决某个应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建。在介绍建模过程的同时穿插操作训练,把相关的知识点嵌入相应的操作过程中。为方便读者轻松地获取真实的实验环境,本书使用目前在数据科学领域非常热门的Python语言对样本数据进行处理以进行挖掘建模。

作者:张良均 等

作品目录

  1. 前言
  2. 基础篇
  3. 第1章 数据挖掘基础
  4. 1.1 某知名连锁餐饮企业的困惑
  5. 1.2 从餐饮服务到数据挖掘
  6. 1.3 数据挖掘的基本任务
  7. 1.4 数据挖掘建模过程
  8. 1.5 常用的数据挖掘建模工具
  9. 1.6 小结
  10. 第2章 Python数据分析简介
  11. 2.1 搭建Python开发平台
  12. 2.2 Python使用入门
  13. 2.3 Python数据分析工具
  14. 2.4 配套资源使用设置
  15. 2.5 小结
  16. 第3章 数据探索
  17. 3.1 数据质量分析
  18. 3.2 数据特征分析
  19. 3.3 Python主要数据探索函数
  20. 3.4 小结
  21. 第4章 数据预处理
  22. 4.1 数据清洗
  23. 4.2 数据集成
  24. 4.3 数据变换
  25. 4.4 数据规约
  26. 4.5 Python主要数据预处理函数
  27. 4.6 小结
  28. 第5章 挖掘建模
  29. 5.1 分类与预测
  30. 5.2 聚类分析
  31. 5.3 关联规则
  32. 5.4 时序模式
  33. 5.5 离群点检测
  34. 5.6 小结
  35. 实战篇
  36. 第6章 电力窃漏电用户自动识别
  37. 6.1 背景与挖掘目标
  38. 6.2 分析方法与过程
  39. 6.3 上机实验
  40. 6.4 拓展思考
  41. 6.5 小结
  42. 第7章 航空公司客户价值分析
  43. 7.1 背景与挖掘目标
  44. 7.2 分析方法与过程
  45. 7.3 上机实验
  46. 7.4 拓展思考
  47. 7.5 小结
  48. 第8章 中医证型关联规则挖掘
  49. 8.1 背景与挖掘目标
  50. 8.2 分析方法与过程
  51. 8.3 上机实验
  52. 8.4 拓展思考
  53. 8.5 小结
  54. 第9章 基于水色图像的水质评价
  55. 9.1 背景与挖掘目标
  56. 9.2 分析方法与过程
  57. 9.3 上机实验
  58. 9.4 拓展思考
  59. 9.5 小结
  60. 第10章 家用电器用户行为分析与事件识别
  61. 10.1 背景与挖掘目标
  62. 10.2 分析方法与过程
  63. 10.3 上机实验
  64. 10.4 拓展思考
  65. 10.5 小结
  66. 第11章 应用系统负载分析与磁盘容量预测
  67. 11.1 背景与挖掘目标
  68. 11.2 分析方法与过程
  69. 11.3 上机实验
  70. 11.4 拓展思考
  71. 11.5 小结
  72. 第12章 电子商务网站用户行为分析及服务推荐
  73. 12.1 背景与挖掘目标
  74. 12.2 分析方法与过程
  75. 12.3 上机实验
  76. 12.4 拓展思考
  77. 12.5 小结
  78. 第13章 财政收入影响因素分析及预测模型
  79. 13.1 背景与挖掘目标
  80. 13.2 分析方法与过程
  81. 13.3 上机实验
  82. 13.4 拓展思考
  83. 13.5 小结
  84. 第14章 基于基站定位数据的商圈分析
  85. 14.1 背景与挖掘目标
  86. 14.2 分析方法与过程
  87. 14.3 上机实验
  88. 14.4 拓展思考
  89. 14.5 小结
  90. 第15章 电商产品评论数据情感分析
  91. 15.1 背景与挖掘目标
  92. 15.2 分析方法与过程
  93. 15.3 上机实验
  94. 15.4 拓展思考
  95. 15.5 小结
载入中

热门划线

  1. 数据挖掘是从大量数据(包括文本)中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程6 人
  2. 分类和预测是预测问题的两种主要类型4 人
  3. ·缺失值。·异常值。·不一致的值。·重复数据及含有特殊符号(如#、¥、*)的数据。3 人
  4. 企业内部信息不完整,零售业、银行、保险和证券等对数据挖掘的应用并不理想。但随着市场竞争的加剧,各行业对数据挖掘技术的需求越来越强烈,可以预计,未来几年各行业的数据分析应用一定会从传统的统计分析发展到大规模数据挖掘应用2 人
  5. ·在点餐过程中,由有经验的服务员根据顾客特点进行菜品推荐,一方面可提高菜品的销量,另一方面可减少客户点餐的时间和频率,提高用户体验。·根据菜品历史销售情况,综合考虑节假日、气候和竞争对手等影响因素,对菜品销量进行预测,以便餐饮企业提前准备原材料。·定期对菜品销售情况进行统计,分类统计出好评菜和差评菜,为促销活动和新菜品推出提供支持。·根据就餐频率和金额对顾客的就餐行为进行评分,筛选出优质客户,定期回访和送去关怀。2 人
  6. 针对具体的数据挖掘应用需求,首先要明确本次的挖掘目标是什么?系统完成后能达到什么样的效果?因此,我们必须分析应用领域,包括应用中的各种知识和应用目标,了解相关领域的情况,熟悉背景知识,弄清用户需求。要想充分发挥数据挖掘的价值,必须对目标有一个清晰明确的定义,即决定到底想干什么。2 人
  7. 一是相关性,二是可靠性,三是有效性2 人
  8. 衡量取样数据质量的标准如下。1)资料完整无缺,各类指标项齐全。2)数据准确无误,反映的都是正常(而不是异常)状态下的水平。2 人
  9. 我们使用map()、reduce()或filter(),最终目的是兼顾简洁和效率,因为map()、reduce()或filter()的循环速度比Python内置的for或while循环要快得多。2 人
  10. 代码清单3-1 餐饮销额数据异常值检测代码2 人

喜欢这本书的人也喜欢