大数据技术和应用

陈建平 陈志德 席进爱
内容简介 这是一本大数据技术入门的简明教材。全书理论和实践相结合,以应用实战为主,深入浅出地讲解每个知识点,对每个应用实验按学习习惯,分步骤讲解,每个步骤都有文字说明和效果截图,使读者能清晰地知晓动手实操的效果和错误之处。 全书分为9章,全面介绍了大数据技术的相关基础知识、HDFS和数据库、采集传输工具、挖掘分析算法、Spark计算框架、可视化、大数据安全、大数据应用等内容,着重介绍了HDFS分布式文件系统、NoSQL等各种数据库、数据仓库Hive,以及数据采集分析技术,并配套了详细的实验教程以及练习题。 本书适合作为高等院校计算机、软件工程、大数据专业高职、本科生的教材,同时可供企业中从事大数据开发的工程师和科技工作者参考。 主编介绍 图片 陈建平 学士,大数据专家讲师,福建师范大学毕业。2006年从事大数据相关的工作,2010年开始从事大数据培训工作,15人以上的大数据团队带队经验。曾承担过BI工程师、数据挖掘工程师、大数据架构师、数据科学家、大数据技术总监、合伙人等职位,曾参与和组织过个性化推荐大数据和图像处理的人工智能等20多个项目,曾在上海IBM公司担任过高级数据挖掘工程师。多次受邀参加学校大数据实验室专家和高校专业论证会等。 精通大数据相关技术,熟悉关系型数据库〇racle\MySQL\DB2,熟悉Green Plum高并发数据库;精通Hadoop、HBase、HDFS、Hive、Pig、Hue、Spark等开源技术,对实时处理Storm、SparkStreaming有较深的认识,熟悉分布式MapReduce计算引擎。精通数据挖掘算法和解决方案。熟悉SPSS\R语言\SparkMLlib\Python等挖掘语言,熟悉决策树、K-means、神经网络、Logistc线性回归、Apriori算法、协同过滤等多种算法。 熟悉零售、电信、移动、电力、证券、网络、物…