大数据时代:生活、工作与思维的大变革
国外大数据研究的先河之作,讲述了大数据时代的思维变革、商业变革和管理变革。 本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。 维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。 维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。 本书认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。 维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger) 他是十余年潜心研究数据科学的技术权威,他是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。 他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。 他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM等全球顶级企业;而他自己早在1986年与1995年就担任两家软件公司的总裁兼CEO,由他的公司开发的病毒通用程序,成为当时奥地利最畅销的软件产品。1991年跻身奥地利软件企业家前5名之列,2000年 被评为奥地利萨尔斯堡州的年度人物。 他也是众多机构和国家政府高层的信息政策智囊。他一直专注于信息安全与信息政策与战略的研究,是欧盟专家之一,也是世界经济论坛、马歇尔计划基金会等重要机构的咨询顾问,同时他以大数据的全球视野,熟悉亚洲信息产业的发展与战略布局,先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。 所著《大数据》一书是开国外大数据系统研究的先河之作,而在这之前,他已经在《经济学人》上和数据编辑肯尼斯.尼尔-库克耶一起,发表了长达14页的大数据专题文章,成为最早洞见大数据时代趋势的数据科学家之一。而他的《删除》一书,同样被认为是关于数据的开创性作品,并且创造了“被遗忘的权利”的概念而在媒体圈和法律圈得到广泛运用。该书获得美国政治科学协会颁发的唐•K•普赖斯奖,以及媒介环境学会颁发的马歇尔•麦克卢汉奖。同时受到《连线》、《自然》《华尔街日报》《纽约时报》等各大权威媒体广泛好评。
2049:未来10000天的可能
本书是凯文·凯利(Kevin Kelly)探讨未来10000天科技与社会发展的前瞻性书籍。书中以2049年为时间节点,展望了人工智能、镜像世界、脑机接口、生命科学等前沿技术如何塑造未来的社会、经济和文化。书中通过五大核心概念(镜像世界、AI助理、互见性、内容井喷、异人智能)和十大发展领域(AI、数字治理、组织变革、教育、医疗、机器人、自动驾驶、航天、生命科学、脑机接口)构建了一个全面的未来图景。 作者通过构建乐观的未来情景,探讨了中国在全球科技竞争中的角色,提出了“酷中国”的愿景,认为未来的中国将通过科技创新和文化输出,成为全球科技和文化的引领者。 书中还深入分析了教育、医疗、组织变革等领域的未来发展趋势,提出了“互见性”“定制化”“丰沛”等理解未来25年的关键词,描绘了一个由AI驱动的、信息高度透明的未来世界。 这不仅是一本未来之书,更是一份行动指南:通过构建乐观的未来场景,激发每个人参与塑造2049的勇气与智慧。 凯文·凯利(Kevin Kelly),《连线》杂志创始主编。在创办《连线》之前,是《全球概览》杂志的编辑和出版人。他还是《纽约时报》《经济学人》《时代周刊》《科学》等的撰稿人。著有《失控》《必然》《科技想要什么》等。1984年,K.K.发起了第一届黑客大会(Hac kers Conference)。K.K.被看作是“赛博文化”的发言人和观察者,也有人称之为“科技预言家”。 凯文·凯利被中国读者亲切地称为K.K.,他的代表作《失控》被誉为“本世纪对西方世界产生巨大影响的最重要的著作之一”。他曾影响了包括乔布斯在内的一代互联网人。 编著:吴晨,财经作家,《经济学人·商论》原总编辑,《经济观察报》专栏作家。著有《聚变》、《转型思维》《超越乌卡》《潜流》《突围》《重塑》等作品。
Redis开发与运维
本书全面讲解Redis基本功能及其应用,并结合线上开发与运维监控中的实际使用案例,深入分析并总结了实际开发运维中遇到的“陷阱”,以及背后的原因, 包含大规模集群开发与管理的场景、应用案例与开发技巧,为高效开发运维提供了大量实际经验和建议。本书不要求读者有任何Redis使用经验,对入门与进阶DevOps的开发者提供有价值的帮助。主要内容包括:Redis的安装配置、API、各种高效功能、客户端、持久化、复制、高可用、内存、哨兵、集群、缓存设计等,Redis高可用集群解决方案,Redis设计和使用中的问题,最后提供了一个开源工具:Redis监控运维云平台CacheCloud。 付磊,搜狐视频高级研发工程师,CacheCloud项目联合创始人。拥有多年Redis开发运维经验,为公司多个核心业务提供Redis服务,同时热衷于技术传播和分享,撰写了大量关于Redis开发运维的技术文章。 张益军,搜狐视频资深研发工程师,CacheCloud项目联合创始人,曾就职于美团、阿里巴巴等公司。搜狐视频投放组负责人,目前从事投放平台、反作弊等系统的架构设计和优化工作。研究兴趣包括海量峰值访问、分布式存储等。
算法图解
本书示例丰富,图文并茂,以让人容易理解的方式阐释了算法,旨在帮助程序员在日常项目中更好地发挥算法的能量。书中的前三章将帮助你打下基础,带你学习二分查找、大O表示法、两种基本的数据结构以及递归等。余下的篇幅将主要介绍应用广泛的算法,具体内容包括:面对具体问题时的解决技巧,比如,何时采用贪婪算法或动态规划;散列表的应用;图算法;K最近邻算法。 Aditya Bhargava,软件工程师,兼具计算机科学和美术方面的教育背景,在adit.io撰写编程方面的博客。
华为数据之道
这是一部从技术、流程、管理等多个维度系统讲解华为数据治理和数字化转型的著作。华为是一家超大型企业,华为的数据底座和数据治理方法支撑着华为在全球170多个国家/地区开展多业态、差异化的运营。书中凝聚了大量数据治理和数字化转型方面的有价值的经验、方法论、规范、模型、解决方案和案例,不仅能让读者即学即用,还能让读者了解华为数字化建设的历程。 华为公司数据管理部著。
大话数据结构
本书为超级畅销书《大话设计模式》作者程杰潜心三年推出的扛鼎之作!以一个计算机教师教学为场景,讲解数据结构和相关算法的知识。通篇以一种趣味方式来叙述,大量引用了各种各样的生活知识来类比,并充分运用图形语言来体现抽象内容,对数据结构所涉及到的一些经典算法做到逐行分析、多算法比较。与市场上的同类数据结构图书相比,本书内容趣味易读,算法讲解细致深刻,是一本非常适合自学的读物。 一个被读者誉为很适合写IT技术书的家伙。《大话设计模式》作者。此书07年末出版至今已经简体版印刷9次、繁体版印刷6次,取得了较好的成绩,开创了一种适合国人阅读的趣味讲解IT知识的风格模式。其本人参与过政府、证券、游戏、交通等多种行业的软件开发及项目管理工作,也曾做过软件培训的教师。因曾有过两年半高中数学教学的独特经历,使得其书作当中处处以初学者视角考虑和分析问题,他成为了当前很受欢迎的IT技术图书作者之一。
数据库系统内幕
本书旨在指导开发者理解现代数据库和存储引擎背后的内部概念,包含从众多书籍、论文、博客和多个开源数据库源代码中精心选取的相关材料。本书深入介绍了数据存储、数据构建块、分布式系统和数据集群,并且指出了现代数据库之间最重要的区别在于决定存储结构和数据分布的子系统。本书分为两部分:第一部分讨论节点本地的进程,并关注数据库系统的核心组件——存储引擎,以及最重要的一个特有元素;第二部分探讨如何将多个节点组织到一个数据库集群中。本书主要面向数据库开发人员,以及使用数据库系统构建软件的人员,如软件开发人员、运维工程师、架构师和工程技术经理。 亚历克斯·彼得罗夫(Alex Petrov),是一位数据基础架构工程师,数据库和存储系统的狂热爱好者,Apache Cassandra提交者和PMC成员,精通存储、分布式系统和算法。
深入理解Kafka:核心设计与实践原理
《深入理解Kafka:核心设计与实践原理》从Kafka的基础概念切入,循序渐进地转入对其内部原理的剖析。《深入理解Kafka:核心设计与实践原理》主要阐述了Kafka中生产者客户端、消费者客户端、主题与分区、日志存储、原理解析、监控管理、应用扩展及流式计算等内容。虽然Kafka的内核使用Scala语言编写,但《深入理解Kafka:核心设计与实践原理》基本以Java语言作为主要的示例语言,方便大多数读者的理解。虽然《深入理解Kafka:核心设计与实践原理》没有明确的界定,但总体上可以划分为三个部分:基础篇、原理篇和扩展篇,前4章为基础篇,包括基础概念、生产者、消费者,以及主题与分区,学习完这4章的内容完全可以应对绝大多数的开发场景。第5章至第8章为原理篇,包括对日志存储、协议设计、控制器、组协调器、事务、一致性、可靠性等内容的探究,学习完这4章的内容可以让读者对Kafka有一个深刻的认知。最后4章从应用扩展层面来做讲解,可以归类为扩展篇,主要内容包括监控、应用工具、应用扩展(延时队列、重试队列、死信队列、消息轨迹等)、与Spark的集成等,让读者可以对Kafka的生态有一个更加全面的认知。 《深入理解Kafka:核心设计与实践原理》定位为一本实战与原理相结合的书,既适合Kafka的初学者,也适合于对Kafka有一定深度认知的老手。 朱忠华,目前主要从事消息中间件相关的研发工作,对RabbitMQ、Kafka等有着自己独特的理解。
利用Python进行数据分析(原书第3版)
本书第1版出版于2012年,彼时基于Python的开源数据分析库(例如pandas)仍然是一个发展迅速的新事物,本书也成为该领域排名No1的经典畅销书,前两版中文版累计销售近30万册。 第3版针对Python3.10和pandas1.4进行了更新,并通过实操讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学习新版本的pandas、NumPy、IPython和Jupyter。 本书作者Wes McKinney是Python pandas项目的创始人。本书对Python数据科学工具的介绍既贴近实战又内容新颖,非常适合刚开始学习Python的数据分析师或刚开始学习数据科学和科学计算的Python程序员阅读。读者可以从GitHub获取数据文件和相关资料。 Wes McKinney是Voltron Data的联合创始人兼首席技术官、Python数据社区的活跃成员,同时也是在数据分析、金融和统计计算等领域推广使用Python的倡导者。Wes毕业于麻省理工学院,同时也是Apache软件基金会的Apache Arrow和Apache Parquet项目的项目管理委员会成员。
算法霸权
我们生活在算法的时代。我们去哪个学校上学,是否能够获得车贷、需要为健康保险支付多少钱,这些对我们的生活有着重大影响的决定越来越由不得人类自己,而是被各种数学模型所操控。从理论上来说,模型可以更好地促进公平,因为每个人适用于同等的规则,不存在偏袒。但凯西•奥尼尔这本迫切而且必要的书却告诉我们,事实刚好相反。如今,被广泛使用的算法模型,即使其本身充斥着错误,也依旧不受管束、不被质疑。其中,“强化歧视”的问题特别值得反思:如果一个穷学生因为被借贷模型认定为风险过高(仅仅是根据该学生所生活的街区就得出此判断)而贷不了款,那么接下来,他就会被剥夺能够帮他摆脱贫困的接受优质教育机会,继而陷入一系列的恶性循环。通过追踪一个人的生命轨迹,凯西·奥尼尔试图在书中揭露数学杀伤性武器对塑造个人和社会未来的影响。这些数学杀伤性武器给教师和学生评分,筛选简历,批准贷款或拒绝贷款,评估员工,甚至监督我们的健康状况,因此凯西·奥尼尔呼吁建模者,要对自己的算法承担更多责任,并且呼吁政策制定者对模型的使用进行监督管理。她指出,对模型的掌控最终取决于我们自己。这本重要的书迫使我们直面问题,揭示真理,要求改变。 凯西·奥尼尔(CathyO'Neil),数据科学家,mathbabe.org的博主。博士毕业于哈佛大学,主修数学专业。她曾在巴纳德学院任教,之后为私营企业服务,例如避险基金。她还在各类新型公司担任数据科学家,预测消费者购买与点击趋势。每周她都会出现在“财富记账”的播客上。