大数据与机器学习

大数据与机器学习

实践方法与行业案例

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
6.213 评价豆瓣读书
春暖花开季 恰是读书时满500减300、满200减120、满100减60活动详情

作品简介

本书从企业实践出发,内容覆盖数据、平台、分析和应用等企业内数据流转的主要环节。布局上,按照数据与平台篇、分析篇和应用篇分别撰写。数据与平台篇(第1~3章),立足找到数据、整合数据、使用数据三个角度,介绍数据在企业内的分布和处理逻辑,以便快速为分析准备素材。分析篇(第4~11章),选取企业实际案例,介绍常用的数据挖掘与机器学习算法,以业务场景为导向展示数据分析过程和技巧。应用篇(第12~15章),选取当前主流的四个应用场景,介绍如何实现数据驱动,让数据“自动”流转于各个环节。

陈春宝,先后获得了经济学硕士和工业工程博士学位,拥有10年数据分析及应用经验,目前任职于股份制商业银行总行,在数据挖掘、机器学习和业务咨询方面有着独到的见解,他的工作跨大数据、营销、风险、运营等多个领域,擅长诊断各类业务问题,应用商业和数据分析手段获得创新性的解决方案,并帮助业务部门有效的实施。

他曾经担任交通银行信用卡中心的数据分析经理,以及美国MSA公司咨询顾问,拥有银行、信用卡、烟草、医药与电信等行业几十个项目的数据挖掘分析与SAS建模经验。基于大数据构建的预测模型,创新了商业模式并为公司带来新的收入来源,参与设计的算法获得人民银行科技发展二等奖。

他还长期负责企业内的数据分析人员培训和管理,并先后担任两个大数据专业期刊的责任编辑,近几年经常作为嘉宾活跃在高校与企业的一系列大数据活动中。曾担任上海交通大学工程硕士企业导师,SCI&EI索引期刊发表论文10余篇。

作品目录

  1. 前言
  2. 第一部分 数据与平台篇
  3. 第1章 数据与数据平台
  4. 1.1 数据的基本形态
  5. 1.2 数据平台
  6. 1.3 应用系统
  7. 1.4 本章小结
  8. 第2章 数据体系
  9. 2.1 数据闭环
  10. 2.2 数据缓冲区
  11. 2.3 ETL
  12. 2.4 作业调度
  13. 2.5 监控和预警
  14. 2.6 本章小结
  15. 第3章 实战:打造数据闭环
  16. 3.1 数据缓冲区的基本规则
  17. 3.2 自动加载的流程
  18. 3.3 自动加载程序的数据库设计
  19. 3.4 自动加载程序的多线程实现
  20. 3.5 本章小结
  21. 第二部分 分析篇
  22. 第4章 数据预处理
  23. 4.1 数据表的预处理
  24. 4.2 变量的预处理
  25. 4.3 变量的设计
  26. 4.4 变量筛选
  27. 4.5 本章小结
  28. 第5章 聚类,简单易用的客户细分方法
  29. 5.1 从客户细分说起
  30. 5.2 谱系聚类
  31. 5.3 K-means算法
  32. 5.4 本章小结
  33. 第6章 关联规则挖掘,发现产品加载和交叉销售机会
  34. 6.1 销售的真谛:让客户买得更多
  35. 6.2 交叉销售
  36. 6.3 关联规则挖掘,发现交叉销售机会
  37. 6.4 案例:信用卡产品交叉销售
  38. 6.5 本章小结
  39. 第7章 社交网络分析,从“关系”的角度分析问题
  40. 7.1 先看几张美轮美奂的图片
  41. 7.2 社交网络分析方法
  42. 7.3 案例:电商通过订单数据识别供应链
  43. 7.4 案例:P2P投资风险防范
  44. 7.5 本章小结
  45. 第8章 线性回归,预测客户价值
  46. 8.1 数值预测
  47. 8.2 回归与拟合
  48. 8.3 案例:信用卡客户价值预测
  49. 8.4 基于客户价值分层的业务策略
  50. 8.5 本章小结
  51. 第9章 Logistic回归,精准营销的主要支撑算法
  52. 9.1 大数据时代的精准营销
  53. 9.2 Logistic回归算法介绍
  54. 9.3 案例:信用卡消费信贷产品的精准营销
  55. 9.4 预测模型的应用与评估
  56. 9.5 本章小结
  57. 第10章 决策树类算法,反欺诈模型“专家”
  58. 10.1 决策树,重要的分类器
  59. 10.2 决策树的关键思想
  60. 10.3 案例:电商盗卡交易风险识别
  61. 10.4 随机森林
  62. 10.5 本章小结
  63. 第11章 数据可视化,是分析更是设计
  64. 11.1 数据演示之道
  65. 11.2 个性化地图
  66. 11.3 文本分析
  67. 11.4 本章小结
  68. 第三部分 应用篇
  69. 第12章 标签系统
  70. 12.1 认识标签系统
  71. 12.2 标签系统的设计
  72. 12.3 标签系统的实现
  73. 12.4 本章小结
  74. 第13章 数据自助营销平台
  75. 13.1 数据自助营销平台的价值所在
  76. 13.2 数据自助营销平台的实现原则
  77. 13.3 数据自助营销平台的场景实例
  78. 13.4 本章小结
  79. 第14章 基于Mahout的个性化推荐系统
  80. 14.1 Mahout的推荐引擎
  81. 14.2 规模与效率
  82. 14.3 实现一个推荐系统
  83. 14.4 本章小结
  84. 第15章 图计算与社会网络
  85. 15.1 社会网络和属性图
  86. 15.2 Spark GraphX与Neo4j
  87. 15.3 使用Spark GraphX和Neo4j处理社会网络
  88. 15.4 本章小结
载入中

大家都喜欢