大数据存储

郭远威
前言 多年来,我一直在和数据库存储技术打交道,深知数据存储技术在整个IT系统中起着至关重要的作用,尤其是随着云计算时代的到来,所有企业都面临着海量的数据信息,如何处理这些数据成为当前研究的热点。在过去二十几年中,数据的存储是关系数据库的天下,它以高效、稳定、支持事务的优势几乎统治了整个行业的存储业务;但是随着互联网的发展,许多新兴产业如社交网络、微博、数据挖掘等业务快速增长,数据规模变得越来越庞大,高效存储、检索、分析这些海量的数据,关系数据库变得不再适用。前几年我们还可以看到网络上关于关系数据库与NoSQL数据库谁优谁劣的激烈讨论,如今NoSQL几乎占据了各大数据库论坛讨论的大部分版块。一些行业领头公司也逐渐将业务迁移到非关系数据库上,NoSQL类型的数据库也变得越来越成熟。当然,在未来一段时间里关系数据库如Oracle、DB、SQL Server等仍会在事务性要求比较高的行业(如银行、电信等)发挥它的作用。 另一方面,在信息技术领域,计算与存储一直是密不可分的,当前我们身处云计算的浪潮中,因此对应的各种云存储技术也呼之欲出。本书将介绍的NoSQL数据库MongoDB正是众多分布式海量数据存储技术中最出色的一种。MongoDB是一种面向文档的分布式数据库,可扩展,表结构自由,支持丰富的查询语句与数据类型,旨在为未来的大数据应用提供高性能的云存储解决方案。当然MongoDB幵不是万能的,随着了解的深入,我们也会发现它的缺点,这也是本书的宗旨,尽量让读者明白它的长处与短处,对于特定的业务选择最合适的数据库存储方案。最后我们希望本书介绍的MongoDB知识能为您在未来的项目中处理海量数据时提供帮助。 本书内容 本书尽量仍一个学习与实践者的角度,本着力求精简、突出精髓的原则,剖析了MongoDB在生产环境中使用需要知道的所有内容,全书分 部分,共章,每章的内容简单介绍如下。 第…