Python机器学习基础教程

Python机器学习基础教程

图灵程序设计丛书

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
8.269 评价豆瓣读书
免费试读

作品简介

本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。

Andreas C. Müller

scikit-learn库维护者和核心贡献者。现任哥伦比亚大学数据科学研究院讲师,曾任纽约大学数据科学中心助理研究员、亚马逊公司计算机视觉应用的机器学习研究员。在波恩大学获得机器学习博士学位。

Sarah Guido

Mashable公司数据科学家,曾担任Bitly公司首席数据科学家。

作品目录

  1. 版权声明
  2. O'Reilly Media, Inc. 介绍
  3. 业界评论
  4. 前言
  5. 目标读者
  6. 写作本书的原因
  7. 本书概览
  8. 在线资源
  9. 排版约定
  10. 使用代码示例
  11. Safari®Books Online
  12. 联系我们
  13. 致谢
  14. 第 1 章 引言
  15. 1.1 为何选择机器学习
  16. 1.2 为何选择Python
  17. 1.3  scikit-learn
  18. 1.4 必要的库和工具
  19. 1.5 Python 2与Python 3的对比
  20. 1.6 本书用到的版本
  21. 1.7 第一个应用:鸢尾花分类
  22. 1.8 小结与展望
  23. 第 2 章 监督学习
  24. 2.1 分类与回归
  25. 2.2 泛化、过拟合与欠拟合
  26. 2.3 监督学习算法
  27. 2.4 分类器的不确定度估计
  28. 2.5 小结与展望
  29. 第 3 章 无监督学习与预处理
  30. 3.1 无监督学习的类型
  31. 3.2 无监督学习的挑战
  32. 3.3 预处理与缩放
  33. 3.4 降维、特征提取与流形学习
  34. 3.5 聚类
  35. 3.6 小结与展望
  36. 第 4 章 数据表示与特征工程
  37. 4.1 分类变量
  38. 4.2 分箱、离散化、线性模型与树
  39. 4.3 交互特征与多项式特征
  40. 4.4 单变量非线性变换
  41. 4.5 自动化特征选择
  42. 4.6 利用专家知识
  43. 4.7 小结与展望
  44. 第 5 章 模型评估与改进
  45. 5.1 交叉验证
  46. 5.2 网格搜索
  47. 5.3 评估指标与评分
  48. 5.4 小结与展望
  49. 第 6 章 算法链与管道
  50. 6.1 用预处理进行参数选择
  51. 6.2 构建管道
  52. 6.3 在网格搜索中使用管道
  53. 6.4 通用的管道接口
  54. 6.5 网格搜索预处理步骤与模型参数
  55. 6.6 网格搜索选择使用哪个模型
  56. 6.7 小结与展望
  57. 第 7 章 处理文本数据
  58. 7.1 用字符串表示的数据类型
  59. 7.2 示例应用:电影评论的情感分析
  60. 7.3 将文本数据表示为词袋
  61. 7.4 停用词
  62. 7.5 用tf-idf缩放数据
  63. 7.6 研究模型系数
  64. 7.7 多个单词的词袋(n元分词)
  65. 7.8 高级分词、词干提取与词形还原
  66. 7.9 主题建模与文档聚类
  67. 7.10 小结与展望
  68. 第 8 章 全书总结
  69. 8.1 处理机器学习问题
  70. 8.2 从原型到生产
  71. 8.3 测试生产系统
  72. 8.4 构建你自己的估计器
  73. 8.5 下一步怎么走
  74. 8.6 总结
  75. 关于作者
  76. 关于封面
  77. 看完了
载入中

热门划线

喜欢这本书的人也喜欢