鲜活的数据

鲜活的数据

数据可视化指南

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
7.3372 评价豆瓣读书
免费试读

作品简介

在生活中,数据几乎无处不在,任我们取用。然而,同样的数据给人的感觉可能会千差万别:或冰冷枯燥,让人望而生畏、百思不解其意;或生动有趣,让人一目了然、豁然开朗。为了达到后一种效果,我们需要采用一种特别的方式来展示数据,来解释、分析和应用它。这就是数据可视化技术。

Nath an Yau是这一创新领域的先锋。在本书中,他根据数据可视化的工作流程,先后介绍了如何获取数据,将数据格式化,用可视化工具(如R)生成图表,以及在图形编辑软件(如Illustrator)中修改以使图表达到最佳效果。本书介绍了数十种方法(如柱形图、饼图、折线图和散点图等),以创造性的视觉方式生动讲述了有关数据的故事。

Nathan Yau 加州大学洛杉矶分校统计学专业在读博士、超级数据迷,专注于数据可视化与个人数据收集。他曾在《纽约时报》、CNN、Mozilla和SyFy工作过,认为数据和信息图不仅适用于分析,用来讲述与数据有关的故事也非常合适。Yau的目标是让非专业人士读懂并用好数据。

向怡宁 交互和视觉设计师、摇滚乐手,同时还热衷于翻译和写作。著有《Flash组件、游戏、SWF加解密》及《就这么简单:Web开发中的可用性和用户体验》,译有《奇思妙想:15位计算机天才及其重大发现》、《瞬间之美:Web界面设计如何让用户心动》、《网站设计解构:有效的交互设计框架和模式》、《网站搜索设计:兼顾SEO及可用性的网站设计心得》等书。

作品目录

  1. 鲜活的数据
  2. 引言
  3. 可视化
  4. 学习数据
  5. 如何阅读本书
  6. 第1章用数据讲故事
  7. 1.1不只是数字
  8. 1.1.1 新闻报道
  9. 1.1.2 艺术
  10. 1.1.3 娱乐
  11. 1.1.4 引人注目
  12. 1.2我们要寻求什么
  13. 1.2.1 模式
  14. 1.2.2 相互关系
  15. 1.2.3 有问题的数据
  16. 1.3设计
  17. 1.3.1 解释编码
  18. 1.3.2 标注坐标轴
  19. 1.3.3 确保几何上的正确性
  20. 1.3.4 提供数据来源
  21. 1.3.5 考虑你的受众
  22. 1.4小结
  23. 第2章 处理数据
  24. 2.1 收集数据
  25. 2.1.1 由他人提供
  26. 2.1.2 寻找数据源
  27. 2.1.3 自动搜集数据
  28. 2.2 设置数据的格式
  29. 2.2.1 数据格式
  30. 2.2.2 格式化工具
  31. 2.2.3 用代码来格式化
  32. 2.3 小结
  33. 第3章 选择可视化工具
  34. 3.1 开箱即用的可视化工具
  35. 3.1.1 可选项
  36. 3.1.2 取舍
  37. 3.2 编程工具
  38. 3.2.1 可选项
  39. 3.2.2 取舍
  40. 3.3 绘图软件
  41. 3.3.1 可选项
  42. 3.3.2 取舍
  43. 3.4 地图绘制工具
  44. 3.4.1 可选项
  45. 3.4.2 取舍
  46. 3.5 衡量各种可选项
  47. 3.6 小结
  48. 第4章 有关时间趋势的可视化
  49. 4.1 在时间中寻求什么
  50. 4.2 时间中的离散点
  51. 4.2.1 柱形
  52. 4.2.2 柱形的堆叠
  53. 4.2.3 圆点
  54. 4.3 延续性数据
  55. 4.3.1 点与点相连
  56. 4.3.2 一步一个台阶
  57. 4.3.3 平滑和估算
  58. 4.4 小结
  59. 第5章 有关比例的可视化
  60. 5.1 在比例中寻求什么
  61. 5.2 整体中的各个部分
  62. 5.2.1 饼图
  63. 5.2.2 面包圈图
  64. 5.2.3 比例中的堆叠
  65. 5.2.4 层级和矩形
  66. 5.3 带时间属性的比例
  67. 5.3.1 堆叠的延续
  68. 5.3.2 逐点详述
  69. 5.4 小结
  70. 第6章 有关关系的可视化
  71. 6.1 在关系中寻求什么
  72. 6.2 关联性
  73. 6.2.1 更多的圆点
  74. 6.2.2 探索更多的变量
  75. 6.2.3 气泡
  76. 6.3 分布
  77. 6.3.1 老式的分布图表
  78. 6.3.2 有关分布的柱形
  79. 6.3.3 延续性的密度
  80. 6.4 对照和比较
  81. 多个分布图表
  82. 6.5 小结
  83. 第7章 发现差异
  84. 7.1 在差异中寻求什么
  85. 7.2 在多个变量间比较
  86. 7.2.1热身
  87. 7.2.2 相面术
  88. 7.2.3 星光灿烂
  89. 7.2.4 平行前进
  90. 7.3 减少维度
  91. 7.4 寻找异常值
  92. 7.5 小结
  93. 第八章 有关空间关系的可视化
  94. 8.1 在空间中寻求什么
  95. 8.2 具体位置
  96. 8.2.1 找到纬度和经度
  97. 8.2.2 单纯的点
  98. 8.2.3 有大有小的点
  99. 8.3 地区
  100. 根据数据来着色
  101. 8.4 跨越空间和时间
  102. 8.4.1 系列组图
  103. 8.4.2 抓住差额
  104. 8.4.3 动画
  105. 8.5 小结
  106. 第9章 有目的地设计
  107. 9.1 让自己作好准备
  108. 9.2 让读者作好准备
  109. 9.3 视觉提示
  110. 9.4 好的可视化
  111. 9.5 小结
载入中

热门划线

  1. 《美国统计摘要》(The Statistical Abstract of the United States)就含有数百个数据表格(见图0-3),但没有任何图表。34 人
  2. 数据是现实生活的一种映射,其中隐藏着许多故事,在那一堆堆的数字之间存在着实际的意义、真相和美学4 人
  3. John Tukey3 人
  4. 统计学其实是在用数据讲故事。我们手头的大堆数据反映了真实的世界,然后我们对它们进行分析,得到的不只是数据的关联性,我们还能了解到身边正在发生什么。3 人
  5. 模式和相互关系3 人
  6. 应用编程接口2 人
  7. 数据就静静地待在我们生活的每一个角落。2 人
  8. 把数字置于视觉空间中,我们的大脑或者读者的大脑就会更容易发现其中潜藏的模式。人类对图形的理解能力确实很强,往往能够从中发现一些通过常规统计方法很难挖掘到的信息。2 人
  9. 探索性数据分析理论(Exploratory Data Analysis)2 人
  10. 在传统媒体向网络媒体转型的过程中,图形的应用变得更加普及。如今的新闻机构中都已设立了专门处理交互、图表或地图数据的各种部门,比如《纽约时报》就专门为“计算机辅助报道”成立了一个新闻编辑部,旗下的记者都专注于用数据来报道新闻。而《纽约时报》的图形编辑部处理起大量数据来也同样得心应手。2 人
  11. 在很长一段时间内人们都认为,可视化就是关于量化后的事实:我们把它们作为工具来识别事物发展的模式,转而为分析研究提供帮助。但可视化并不仅仅与冰冷的事实有关。2 人
  12. 图表和图形逐渐也超出了工具的范畴,发展为传达理念的载体。GraphJam和Indexed之类的网站就喜欢运用文氏图、饼图等形式来戏谑流行歌曲及文化,用红白黑等颜色组合来讥讽政客,或者谴责虐待动物的行为。我自己也在这个方向上作了一些尝试,在FlowingData上发表了系列漫画Data Underload(数据低负荷)。在图0-5中,我用图形表现了美国电影协会评选出的一些经典电影台词——非常无厘头,但很有趣(至少对我来说如此)。2 人
  13. 我们绘制演示用的图例也好、进行数据分析也好、用数据来报道新闻也罢,最终其实都是在寻求真相2 人
  14. 这些故事反过来可以帮助我们解决真实世界中存在的问题,例如降低犯罪率、提高卫生意识、改善高速上的交通状况,或者只是增长我们的见识。2 人
  15. 永远都要让数据说话。2 人
  16. 图表和图形并不只是将统计结果可视化,它们还对可视化展现的内容进行解释。2 人
  17. 重点是,数据和可视化并不一定只能和冰冷的、不争的事实相关。有时我们寻求的并不是分析和洞察,而是从富有情感的观点来讲述故事,鼓励读者对数据作出回应。2 人
  18. Trendalyzer2 人
  19. 如何拆分数据则取决于你需要(或不需要)多少细节。2 人
  20. 在统计学中,它通常代表的是关联性和因果关系。多个变量之间应该存在着某种联系。2 人
  21. 图1-82 人
  22. 当你需要处理很多不同的数据集时,请尝试将它们进行分组,而不是当做互不干涉的单独元素来看待。这样能够产生更加有趣的结果。2 人
  23. 大部分异常都只是笔误而已,但有些异常却真的存在,而它们就是有意思的地方,可以作为故事的重点。如果你遇到了异常,一定要确定它到底属于前者还是后者。2 人
  24. 你也可以在《纽约时报》等新闻机构发布的图表中寻找数据源。这些来源通常都会以小字体附在图表的某处。2 人
  25. 数据及故事图书馆(Data and Story Library,DASL,http://lib.stat.cmu.edu/DASL/)——有关数据文件以及讲述基础统计方法用法的在线图书馆,来自卡内基梅隆大学。伯克利数据实验室(Berkeley Data Lab,http://sunsite3.berkeley.edu/wikis/datalab/)——加州大学伯克利分校图书馆系统的一部分。加州大学洛杉矶分校统计数据库(UCLA Statistics Data Sets,www.stat.ucla.edu/data/)——加州大学洛杉矶分校统计学院的数据库,主要用于实验室和课程练习。2 人
  26. 亚马逊公用数据库(Amazon Public Data Sets,http://aws.amazon.com/publicdatasets)——更新不多,但确实有一些科研方面的大型数据集。2 人
  27. 终端Terminal(应用程序里面)2 人
  28. 看一下网站地图,或者通过搜索引擎查阅网站目录2 人
  29. 4. Tableau Software2 人
  30. Sparkline(微线表)库2 人
  31. Processing2 人
  32. 离散时间和延续时间2 人
  33. 这些不符常规的地方正是我们应该关注之处2 人
  34. 时间数据可以分为离散时间和延续时间两种。2 人
  35. 需要在数据块名称后面加上美元符号($),然后再加上该列的名称2 人
  36. 每一个柱形的名称2 人
  37. 如果数据存在子分类,且各子分类之和有意义,我们就可以用到堆叠柱形图2 人
  38. 这种类型的图表通常被称为散点图(scatterplot),你也可以用它来表现非时间数据。它通常用于表现两个变量之间的关系2 人
  39. 你可以利用可视化作为探索的工具。仔细观察某个时间段,尝试解释为什么在这一天会有小波动,或者为什么在那一天又会突然上升。2 人
  40. 归根结底,从最本质的层面来说,可视化就是将数据(可以是数字、文本、类别或任何其他东西)转换为视觉元素。有一些视觉元素比其他元素更具提示性,但不一定适用于所有数据集。对某种数据集完全不适用的方法,对另一种数据集来说可能是黄金搭配。通过不断的实践,我们很快就能找到最适合当前设计意图的可视化方法。2 人
  41. 欲知Hans Rosling如何用数据和精彩的演示赢得现场观众的喝彩,访问http://datafl.ws/ hans。2 人

喜欢「鲜活的数据」的人也喜欢