Greenplum:从大数据战略到实现

冯雷 姚延栋 高小明 等
编委会 (按姓氏拼音顺序) 主编:冯雷  姚延栋  高小明  杨瑜 编写组:郭罡  李阳  林文  任振中  王昊  王淏舟  翁岩青  吴疆  张桓 出版统筹:段旻 序 “大数据”一词最早出现于20世纪90年代,作为一个技术术语流行起来则始于2012年。时至今日,该词仍没有统一、明确的定义。人们通常从Volume、Velocity、Variety等角度定义大数据,而最吸引大众是Volume这一特点。根据维基百科的介绍,自20世纪80年代起,人均存储信息的能力每40个月增加一倍;截至2012年,全世界每天产生2.5艾字节(1018字节)的数据。IDC报告预测,全球数据将从2018年的33泽字节(1021字节)增长到2025年的175泽字节,其中近30%数据需要实时处理。世界正在以前所未有的速度数字化和创造数据。数字化时代到来了,数据时代到来了! 随着数据时代的到来,越来越多的企业和政府开始重视大数据及相关技术。2012年,美国政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家意志。美国政府将数据定义为“未来的新石油”,并表示一个国家拥有数据的规模、活性及解释运用的能力将成为综合国力的重要组成部分。未来,对数据的占有和控制甚至将成为陆权、海权、空权之外的一种国家核心资产。随后多国政府和很多组织提出了相应的大数据战略。 然而,任何行业的升级、发展都不是一蹴而就的。就目前来看,不同企业和组织处于四种不同的数字化和大数据阶段:传统阶段、数字阶段、数据阶段和数学阶段。传统阶段指企业仍然以传统的方式使用软件技术,其主要特点是用软件支撑企业内部流程,通常是由企业内部的IT部门主导;数字阶段指企业开始用全新的视角看待和使用软件,软件成为公司主营业务的重要组成部分或者主要组成部分;数据阶段指企业通过全业务的数字化,积累大量数据,再通过数据分析,从数据中获取洞见,反过…