探寻数据背后的逻辑:R语言数据挖掘之道

探寻数据背后的逻辑:R语言数据挖掘之道

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。

作品简介

数据分析、数据挖掘的本质是探寻数据背后的逻辑,挖掘人们的欲望、需求、态度等。《探寻数据背后的逻辑:R语言数据挖掘之道》不仅仅教会读者如何掌握数据挖掘相关技能,更教会读者如何从数据挖掘结果中分析出更深层次的逻辑。

《探寻数据背后的逻辑:R语言数据挖掘之道》主要介绍使用R语言进行数据挖掘的过程。具体内容包括R软件的安装及R语言基础知识、数据探索、数据可视化、回归预测分析、时间序列分析、算法选择流程及十大算法介绍、数据抓取、社交网络关系分析、情感分析、话题模型、推荐系统,以及数据挖掘在生物信息学中的应用。另外,《探寻数据背后的逻辑:R语言数据挖掘之道》还介绍了R脚本优化相关内容,使读者的数据挖掘技能更上一层楼。

《探寻数据背后的逻辑:R语言数据挖掘之道》适合从事数据挖掘、数据分析、市场研究的工作者及学生群体,以及对数据挖掘和数据分析感兴趣的初级读者。

宋云生,中山大学生命科学学院硕士毕业,混迹于医药商业、汽车制造等多个行业,先后从事市场研究、BI(商业智能)、质量控制等多个领域的数据研究和落地应用,现主攻自然语言理解领域的实际应用。

张坚洪,华南农业大学数学与应用数学本科毕业,先后从事汽车、金融等行业,主要工作方向为数据仓库、数据挖掘在互联网金融领域的应用。

黎新年,中山大学生命科学学院博士毕业,主要研究方向为基因组的进化、群体演化和系统发育。

作品目录

  1. 作者简介
  2. 序言 提纲挈领式心诀:一名数据挖掘工程师的成长之路
  3. 前言 什么是规范化的数据挖掘流程
  4. 其他
  5. 第1章 万事不只开头难
  6. 1.1 工欲善其事,必先利其器:安装
  7. 1.2 了解R的对象
  8. 1.3 R语言的重器:函数
  9. 1.4 控制流在R语言里只是一种辅助工具
  10. 1.5 数据的读入与输出
  11. 第2章 数据探索,招招都是利器
  12. 2.1 不要在工作后才认识“脏数据”
  13. 2.2 数据透视、数据整形、关联融合与批量处理
  14. 2.3 一招完成数据探索报告
  15. 2.4 拯救你的很多时候是基础理论
  16. 第3章 从商务气质的数据可视化说起
  17. 3.1 说说数据可视化的专业素养
  18. 3.2 ggplot2包:一个价值8万美元的态度
  19. 3.3 将静态图转为D3交互图表:plotly
  20. 3.4 从基础到进阶的变形图表
  21. 第4章 分位数回归模拟股票指数风险通道
  22. 4.1 用线性回归预测医院的药品销售额
  23. 4.2 多项式回归及常见回归方程的书写
  24. 4.3 Lasso回归和回归评价的常见指标
  25. 4.4 分位数回归拟合上证指数风险通道
  26. 第5章 时间序列分析
  27. 5.1 时间序列分析:分析带有时间属性的数列
  28. 5.2 不是所有序列都叫时间序列
  29. 5.3 时间序列三件宝:趋势、周期、随机波动
  30. 5.4 预测分析
  31. 第6章 选择什么算法也有一套流程
  32. 6.1 重新审视一下这几个模型
  33. 6.2 银行信用卡评估模型之变量筛选
  34. 6.3 必须面对的模型评估
  35. 第7章 深入浅出十大算法
  36. 7.1 C5.0算法
  37. 7.2 K-means算法
  38. 7.3 支持向量机(SVM)算法
  39. 7.4 Apriori算法
  40. 7.5 EM算法
  41. 7.6 PageRank算法
  42. 7.7 AdaBoost算法
  43. 7.8 KNN算法与K-means算法有什么不同
  44. 7.9 Naive Bayes(朴素贝叶斯)算法
  45. 7.10 CART算法
  46. 第8章 数据抓取
  47. 8.1 数据挖掘工程师不可抱怨“巧妇难为无米之炊”
  48. 8.2 抓取股市龙虎榜数据,碰碰运气
  49. 8.3 抓取某家医药信息网站全站药品销售数据
  50. 第9章 不可不说的社交网络关系
  51. 9.1 社交网络图
  52. 9.2 你还要装备几个评价指标
  53. 9.3 全球某货物贸易中的亲密关系
  54. 9.4 中国电影演艺圈到底有没有“圈”
  55. 第10章 情感分析:一种准确率高达90%的新方法?
  56. 10.1 情感分析及其应用:这是老生常谈
  57. 10.2 文本分析的基本武器:R
  58. 10.3 基于词典的情感分析的效果好过瞎猜吗
  59. 10.4 监督式情感分析:挑选训练数据集是所有人心中的痛
  60. 10.5 一种准确率高达90%的新方法
  61. 10.6 谈谈情感分析的下一步思考
  62. 第11章 话题模型:很多牛人过不去的坎儿
  63. 11.1 话题模型与文案文本集
  64. 11.2 话题模型中几个重要的数据处理步骤
  65. 11.3 上帝有多少个色子:话题数量估计
  66. 11.4 LDA话题模型竟然能输出这么多关系
  67. 11.5 话题之间也有社交(衍生)关系吗
  68. 11.6 话题模型的几个强大衍生品
  69. 第12章 排名就是简单的推荐系统吗?
  70. 12.1 全球宜居城市综合实力排行
  71. 12.2 协同过滤推荐系统
  72. 第13章 生物信息学中的数据挖掘案例
  73. 13.1 生物信息学与R语言
  74. 13.2 生物信息学中常用的软件包
  75. 第14章 产品化:关于内存、速度和自动化
  76. 14.1 不同终端调用、自动化执行R脚本及参数传递
  77. 14.2 与速度、内存、并行相关的程序优化