
作品简介
国外大数据研究的先河之作,讲述了大数据时代的思维变革、商业变革和管理变革。
本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。
维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。
维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。
本书认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。
维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger)
他是十余年潜心研究数据科学的技术权威,他是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。
他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。
他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM等全球顶级企业;而他自己早在1986年与1995年就担任两家软件公司的总裁兼CEO,由他的公司开发的病毒通用程序,成为当时奥地利最畅销的软件产品。1991年跻身奥地利软件企业家前5名之列,2000年 被评为奥地利萨尔斯堡州的年度人物。
他也是众多机构和国家政府高层的信息政策智囊。他一直专注于信息安全与信息政策与战略的研究,是欧盟专家之一,也是世界经济论坛、马歇尔计划基金会等重要机构的咨询顾问,同时他以大数据的全球视野,熟悉亚洲信息产业的发展与战略布局,先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。
所著《大数据》一书是开国外大数据系统研究的先河之作,而在这之前,他已经在《经济学人》上和数据编辑肯尼斯.尼尔-库克耶一起,发表了长达14页的大数据专题文章,成为最早洞见大数据时代趋势的数据科学家之一。而他的《删除》一书,同样被认为是关于数据的开创性作品,并且创造了“被遗忘的权利”的概念而在媒体圈和法律圈得到广泛运用。该书获得美国政治科学协会颁发的唐•K•普赖斯奖,以及媒介环境学会颁发的马歇尔•麦克卢汉奖。同时受到《连线》、《自然》《华尔街日报》《纽约时报》等各大权威媒体广泛好评。
作品目录
推荐序一 拥抱“大数据时代”
推荐序二 实实在在大数据
译者序 在路上·晃晃悠悠
引言 一场生活、工作与思维的大变革
大数据,变革公共卫生
大数据,变革商业
大数据,变革思维
大数据,开启重大的时代转型
预测,大数据的核心
大数据,大挑战
第一部分 大数据时代的思维变革
01 更多:不是随机样本,而是全体数据
让数据“发声”
小数据时代的随机采样,最少的数据获得最多的信息
全数据模式,样本=总体
02 更杂:不是精确性,而是混杂性
允许不精确
大数据的简单算法比小数据的复杂算法更有效
纷繁的数据越多越好
混杂性,不是竭力避免,而是标准途径
新的数据库设计的诞生
03 更好:不是因果关系,而是相关关系
林登与亚马逊推荐系统
关联物,预测的关键
“是什么”,而不是“为什么”
改变,从操作方式开始
大数据,改变人类探索世界的方法
第二部分 大数据时代的商业变革
04 数据化:一切皆可“量化”
莫里的导航图,大数据的最早实践之一
数据,从最不可能的地方提取出来
数据化,不是数字化
量化一切,数据化的核心
当文字变成数据
当方位变成数据
当沟通变成数据
世间万物的数据化
05 价值:“取之不尽,用之不竭”的数据创新
ReCaptcha与数据再利用
数据的“潜在价值”
数据创新1:数据的再利用
数据创新2:重组数据
数据创新3:可扩展数据
数据创新4:数据的折旧值
数据创新5:数据废气
数据创新6:开放数据
给数据估值
06 角色定位:数据、技术与思维的三足鼎立
Decide.com与商品价格预测
大数据价值链的3大构成
大数据掌控公司
大数据技术公司
大数据思维公司和个人
全新的数据中间商
专家的消亡与数据科学家的崛起
大数据,决定企业竞争力
第三部分 大数据时代的管理变革
07 风险:让数据主宰一切的隐忧
无处不在的“第三只眼”
我们的隐私被二次利用了
预测与惩罚,不是因为“所做”,而是因为“将做”
数据独裁
挣脱大数据的困境
08 掌控:责任与自由并举的信息管理
一场管理规范的变革
管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任
管理变革2:个人动因VS预测分析
管理变革3:击碎黑盒子,大数据算法师的崛起
管理变革4:反数据垄断大亨
结语 正在发生的未来
凡是过去,皆为序曲
大数据时代,名副其实的“信息社会”
更大的数据源于人本身
参考文献
热门划线
大数据的核心就是预测。41 人
大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。30 人
大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。26 人
第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。24 人
第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。24 人
这仅仅只是一个开始,大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。最惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。也就是说只需要知道是什么,而不需要知道为什么。这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战。22 人
大数据与云计算是一个问题的两面:一个是问题,一个是解决问题的方法。21 人
要全体不要抽样,要效率不要绝对精确,要相关不要因果21 人
第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。20 人
“大数据”发展的障碍,在于数据的“流动性”和“可获取性”。17 人
●首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。●其次,我们乐于接受数据的纷繁复杂,而不再追求精确性。●最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。14 人
适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力。13 人
当样本数量达到了某个值之后,我们从新个体身上得到的信息会越来越少,就如同经济学中的边际效应递减一样。13 人
根据所提供价值的不同来源,分别出现了三种大数据公司。这三种来源是指:数据本身、技能与思维。13 人
大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。12 人
世界的本质就是数据11 人
只研究样本而不是整体,有利有弊:能更快更容易地发现问题,但不能回答事先未考虑到的问题。11 人
真正的革命并不在于分析数据的机器,而在于数据本身和我们如何运用数据。9 人
它是把数学算法运用到海量的数据上来预测事情发生的可能性。9 人
实际上,大数据与三个重大的思维转变有关,这三个转变是相互联系和相互作用的。●首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。●其次,我们乐于接受数据的纷繁复杂,而不再追求精确性。●最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。9 人
建立在相关关系分析法基础上的预测是大数据的核心。9 人
随着规模的扩大,对精确度的痴迷将减弱。8 人
大数据的简单算法比小数据的复杂算法更有效8 人
维克托指出,大数据时代的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识,得到过去无法企及的商机。7 人
数据的奥妙只为谦逊、愿意聆听且掌握了聆听手段的人所知。7 人
统计学家们证明:采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。7 人
全数据模式,样本=总体7 人
亚马逊深谙数字化内容的意义,而谷歌触及了数据化内容的价值。7 人
最重要的是人们可以在很大程度上从对于因果关系的追求中解脱出来,转而将注意力放在相关关系的发现和使用上。6 人
就是大数据时代,要允许一点点的错误和不完美,因为效率可能更加重要!6 人
大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……6 人
大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关关系转化时释放出的潜在价值的态度,正是主宰这场游戏的关键。6 人
对我们而言,危险不再是隐私的泄露,而是被预知的可能性——这些能预测我们可能生病、拖欠还款和犯罪的算法会让我们无法购买保险、无法贷款、甚至在实施犯罪前就被预先逮捕。6 人
执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。6 人
大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今的信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚光灯打向“I”,开始关注信息本身了。6 人
所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。6 人
也许,大数据预测可以为我们打造一个更安全、更高效的社会,但是却否定了我们之所以为人的重要组成部分——自由选择的能力和行为责任自负。大数据成为了集体选择的工具,但也放弃了我们的自由意志。6 人