学习R

学习R

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
7.753 评价豆瓣读书
免费试读

作品简介

本书分为上下两部分,旨在指导你如何使用R,并提供练习的机会。上半部分主要介绍R的技术细节和使用技巧。每章都简要介绍了一组不同的数据类型(例如第4章介绍向量、矩阵和数组)或概念(例如第8章介绍分支和循环)。下半部分更侧重实践,展示了从输入数据到发布结果这一标准的数据分析流程。

即使你没有任何编程基础,也能顺利阅读本书。

编写简单的R程序,知道R语言能做什么

使用向量、数组、列表、数据框和字符串等数据类型

掌握条件语句以及分支和循环控制语句

应用R的扩展包,将你自己的工作成果打包发给其他人

清理从各种来源导入的数据

通过可视化和汇总统计理解数据

使用统计模型传递关于数据的定量判断并进行预测

了解编写数据分析代码时出现错误的应对措施

Richard Cotton

是一位通晓化学安全及健康的数据科学家,开发过很多能让非专业用户访问统计模型的工具。他开发了很多R包,如assertive(用于检查变量的状态)和sig(用于确保功能具有合理的API)。他也是The Damned Liars公司的统计学顾问。

作品目录

  1. O'Reilly Media,Inc.介绍
  2. 业界评论
  3. 译者序
  4. 前言
  5. 关于本书
  6. 本书主要内容
  7. 你应该读哪几章
  8. 本书排版约定
  9. 目标、小结、小测验和练习
  10. 使用代码
  11. Safari \(^{®}\) Books Online
  12. 联系我们
  13. 致谢
  14. 第一部分 R语言
  15. 第1章 简介
  16. 1.1 本章目标
  17. 1.2 R是什么
  18. 1.3 安装R
  19. 1.4 选择一个IDE
  20. 1.4.1 Emacs+ESS
  21. 1.4.2 Eclipse/Architect
  22. 1.4.3 RStudio
  23. 1.4.4 Revolution-R
  24. 1.4.5 Live-R
  25. 1.4.6 其他IDE和编辑器
  26. 1.5 你的第一个程序
  27. 1.6 如何从R中获得帮助
  28. 1.7 安装其他相关软件
  29. 1.8 小结
  30. 1.9 知识测试:问题
  31. 1.10 知识测试:练习
  32. 第2章 科学计算器
  33. 2.1 本章目标
  34. 2.2 数学运算符和向量
  35. 2.3 变量赋值
  36. 2.4 特殊数字
  37. 2.5 逻辑向量
  38. 2.6 小结
  39. 2.7 知识测试:问题
  40. 2.8 知识测试:练习
  41. 第3章 检查变量和工作区
  42. 3.1 本章目标
  43. 3.2 类
  44. 3.3 不同类型的数字
  45. 3.4 其他通用类
  46. 3.5 检查和更改类
  47. 3.6 检查变量
  48. 3.7 工作区
  49. 3.8 小结
  50. 3.9 知识测试:问题
  51. 3.10 知识测试:练习
  52. 第4章 向量、矩阵和数组
  53. 4.1 本章目标
  54. 4.2 向量
  55. 4.2.1 序列
  56. 4.2.2 长度
  57. 4.2.3 命名
  58. 4.2.4 索引向量
  59. 4.2.5 向量循环和重复
  60. 4.3 矩阵和数组
  61. 4.3.1 创建数组和矩阵
  62. 4.3.2 行、列和维度
  63. 4.3.3 行名、列名和维度名
  64. 4.3.4 索引数组
  65. 4.3.5 合并矩阵
  66. 4.3.6 数组算术
  67. 4.4 小结
  68. 4.5 知识测试:问题
  69. 4.6 知识测试:练习
  70. 第5章 列表和数据框
  71. 5.1 本章目标
  72. 5.2 列表
  73. 5.2.1 创建列表
  74. 5.2.2 原子变量和递归变量
  75. 5.2.3 列表的维度和算术运算
  76. 5.2.4 索引列表
  77. 5.2.5 向量和列表之间的转换
  78. 5.2.6 组合列表
  79. 5.3  NULL
  80. 5.4 成对列表
  81. 5.5 数据框
  82. 5.5.1 创建数据框
  83. 5.5.2 索引数据框
  84. 5.5.3 基本数据框操作
  85. 5.6 小结
  86. 5.7 知识测试:问题
  87. 5.8 知识测试:练习
  88. 第6章 环境和函数
  89. 6.1 本章目标
  90. 6.2 环境
  91. 6.3 函数
  92. 6.3.1 创建和调用函数
  93. 6.3.2 向其他函数传递和接收函数
  94. 6.3.3 变量的作用域
  95. 6.4 小结
  96. 6.5 知识测试:问题
  97. 6.6 知识测试:练习
  98. 第7章 字符串和因子
  99. 7.1 本章目标
  100. 7.2 字符串
  101. 7.2.1 创建和打印字符串
  102. 7.2.2 格式化数字
  103. 7.2.3 特殊字符
  104. 7.2.4 更改大小写
  105. 7.2.5 截取字符串
  106. 7.2.6 分割字符串
  107. 7.2.7 文件路径
  108. 7.3 因子
  109. 7.3.1 创建因子
  110. 7.3.2 更改因子水平
  111. 7.3.3 去掉因子水平
  112. 7.3.4 有序因子
  113. 7.3.5 将连续变量转换为类别
  114. 7.3.6 将类别变量转换为连续变量
  115. 7.3.7 生成因子水平
  116. 7.3.8 合并因子
  117. 7.4 小结
  118. 7.5 知识测试:问题
  119. 7.6 知识测试:练习
  120. 第8章 流程控制和循环
  121. 8.1 本章目标
  122. 8.2 流程控制
  123. 8.2.1  if 和 else
  124. 8.2.2 矢量化的 if
  125. 8.2.3 多个分支
  126. 8.3 循环
  127. 8.3.1 重复循环
  128. 8.3.2  while 循环
  129. 8.3.3  for 循环
  130. 8.4 小结
  131. 8.5 知识测试:问题
  132. 8.6 知识测试:练习
  133. 第9章 高级循环
  134. 9.1 本章目标
  135. 9.2  replication
  136. 9.3 遍历列表
  137. 9.4 遍历数组
  138. 9.5 多个输入的应用函数
  139. 即时向量化(Instant Vectorization)
  140. 9.6 拆分—应用—合并(Split-Apply-Combine)
  141. 9.7  plyr 包
  142. 9.8 小结
  143. 9.9 知识测验:问题
  144. 9.10 知识测试:练习
  145. 第10章 包
  146. 10.1 本章目标
  147. 10.2 加载包
  148. 10.2.1 搜索路径
  149. 10.2.2 库和已安装的包
  150. 10.3 安装包
  151. 10.4 维护包
  152. 10.5 小结
  153. 10.6 知识测试:问题
  154. 10.7 知识测试:练习
  155. 第11章 日期和时间
  156. 11.1 本章目标
  157. 11.2 日期和时间类
  158. 11.2.1 POSIX日期和时间
  159. 11.2.2  Date 类
  160. 11.2.3 其他日期类
  161. 11.3 日期与字符串的相互转换
  162. 11.3.1 解析日期
  163. 11.3.2 格式化日期
  164. 11.4 时区
  165. 11.5 日期和时间的算术运算
  166. 11.6  lubridate
  167. 11.7 小结
  168. 11.8 知识测试:问题
  169. 11.9 知识测试:练习
  170. 第二部分 数据分析工作流
  171. 第12章 获取数据
  172. 12.1 本章目标
  173. 12.2 内置的数据集
  174. 12.3 读取文本文件
  175. 12.3.1 CSV和制表符分隔(Tab-Delimited)文件
  176. 12.3.2 非结构化文本文件
  177. 12.3.3 XML和HTML文件
  178. 12.3.4 JSON和YAML文件
  179. 12.4 读取二进制文件
  180. 12.4.1 读取Excel文件
  181. 12.4.2 读取SAS、Stata、SPSS和MATLAB文件
  182. 12.4.3 读取其他文件类型
  183. 12.5 Web数据
  184. 12.5.1 拥有API的网站
  185. 12.5.2 抓取网页
  186. 12.6 访问数据库
  187. 12.7 小结
  188. 12.8 知识测试:问题
  189. 12.9 知识测试:练习
  190. 第13章 数据清理和转换
  191. 13.1 本章目标
  192. 13.2 清理字符串
  193. 13.3 操作数据框
  194. 13.3.1 添加和替换列
  195. 13.3.2 处理缺失值
  196. 13.3.3 在宽和长表格之间进行转换
  197. 13.3.4 使用SQL
  198. 13.4 排序
  199. 13.5 函数式编程
  200. 13.6 小结
  201. 13.7 知识测试:问题
  202. 13.8 知识测试:练习
  203. 第14章 探索和可视化
  204. 14.1 本章目标
  205. 14.2 汇总统计
  206. 14.3 三种绘图系统
  207. 14.4 散点图
  208. 14.4.1 第一种方法: base 绘图法
  209. 14.4.2 第二种方法:lattice图形系统
  210. 14.4.3 第三种方法:ggplot2图形系统
  211. 14.4.4 线图
  212. 14.5 直方图
  213. 14.6 箱线图
  214. 14.7 条形图
  215. 14.8 其他的绘图包和系统
  216. 14.9 小结
  217. 14.10 知识测试:问题
  218. 14.11 知识测试:练习
  219. 第15章 分布与建模
  220. 15.1 本章目标
  221. 15.2 随机数
  222. 15.2.1 示例函数
  223. 15.2.2 从分布中抽样
  224. 15.3 分布
  225. 15.4 公式
  226. 15.5 第一个模型:线性回归
  227. 15.5.1 比较和更新模型
  228. 15.5.2 绘图和模型检查
  229. 15.6 其它模型类型
  230. 15.7 小结
  231. 15.8 知识测试:问题
  232. 15.9 知识测试:练习
  233. 第16章 程序设计
  234. 16.1 本章目标
  235. 16.2 信息、警告和错误
  236. 16.3 错误处理
  237. 16.4 调试
  238. 16.5 测试
  239. 16.5.1  RUnit
  240. 16.5.2 testthat
  241. 16.6 魔法
  242. 16.6.1 将字符串转换成代码
  243. 16.6.2 把代码转换成字符串
  244. 16.7 面向对象编程
  245. 16.7.1 S3类
  246. 16.7.2 引用类
  247. 16.8 小结
  248. 16.9 知识测试:问题
  249. 16.10 知识测试:练习
  250. 第17章 制作程序包
  251. 17.1 本章目标
  252. 17.2 为什么要创建软件包
  253. 17.3 先决条件
  254. 17.4 包目录结构
  255. 17.5 你的第一个包
  256. 17.6 为包撰写文档
  257. 17.7 检查和构建包
  258. 17.8 包的维护
  259. 17.9 小结
  260. 17.10 知识测试:问题
  261. 17.11 知识测试:练习
  262. 附录A 变量的属性
  263. 附录B R中其他可做的事情
  264. 附录C 问题答案
  265. 附录D 练习答案
  266. 参考文献
  267. 关于封面
  268. 看完了
载入中

热门划线

喜欢这本书的人也喜欢