作品简介
大数据时代,R语言已成为数据分 析的利器,是挖掘数据价值必不可少的工具,截止到2014年5月,R语言的软件包有5500多个。如何使用这众多的软件包,是R语言学习者和使用者遇到的最大问题。本书将告诉读者R语言在真实环境下到底能够做什么,并且详细地告诉你怎样一步一步地实施。书中结合作者的使用心得及案例分析,介绍了30多个R语言包,一定会解决R语言使用者的诸多困扰。
本书是R语言入门后的进阶读物,为用户灵活使用R语言提供思路上的扩展,给出进阶的学习路线。书中内容来自作者在R语言的实际使用过程中的经验总结,其中涉及计算机、互联网、数据库、大数据、统计、金融等领域,详细总结了R语言在实际使用时与Java、MySQL、Redis、MongoDB、Cassandra、Hadoop、Hive、HBase等技术的综合运用的解决方案,具有实战性、可操作性。从本书中,读者既可以看到R语言在各行业、各领域所散发的魅力,也能看到R语言在与其他计算机语言结合后所迸发的强大活力,解决在使用R语言过程中遇到的瓶颈;书中具有全局观的案例实施,也会给读者带来新的启发。
本书姊妹篇《R的极客理想——高级开发篇》将深入介绍R语言底层原理,并使用R语言开发出企业级的应用。
张丹 R语言资深用户,系统架构师,精通Java、JavaScript、Node.js等多种工具,曾开发多种不同类型的系统及应用,目前在量化投资领域创业中。张丹在其个人博客原创了大量关于R语言和Hadoop大数据技术的文章,2013年,他的RHadoop系列文章在统计之都发表。他还是Dataguru的培训讲师,教授课程《Hadoop应用开发实战案例》、《Mahout机器学习平台》。
微博:http://weibo.com/dotabook,@Conan_Z
作品目录
序一
序二
前言
为什么要写这本书
读者对象
如何阅读本书
勘误和支持
致谢
第一部分 R基础
第1章 R语言基础包
1.1 R是最值得学习的编程语言
1.2 R的历史版本安装
1.3 fortunes记录R语言的大智慧
1.4 formatR代码自动化排版
1.5 多人在线协作R开发RStudio Server
1.6 R和JSON的傻瓜式编程
1.7 R语言的高质量图形渲染库Cairo
1.8 caTools:一个奇特的工具集
第2章 时间序列基础包
2.1 R语言时间序列基础库zoo
2.2 可扩展的时间序列xts
2.3 时间序列可视化plot.xts
第3章 R性能监控包
3.1 R语言本地缓存工具memoise
3.2 R语言性能监控工具Rprof
3.3 R语言性能可视化工具lineprof
第二部分 R服务器
第4章 R语言的跨平台通信
4.1 Rserve与Java的跨平台通信
4.2 Rsession让Java调用R更简单
4.3 解惑rJava R与Java的高速通道
4.4 Node.js与R跨平台通信
第5章 R的服务器实现
5.1 R语言服务器程序Rserve详解
5.2 Rserve的R语言客户端RSclient
5.3 FastRWeb:跑在Web上的R程序
5.4 R语言构建Websocket服务器
第三部分 数据库和大数据
第6章 数据库和NoSQL
6.1 RMySQL数据库编程指南
6.2 R利剑NoSQL 之MongoDB
6.3 R利剑NoSQL之Redis
6.4 R利剑NoSQL之Cassandra
6.5 R利剑NoSQL之Hive
6.6 用RHive从历史数据中提取逆回购信息
第7章 RHadoop
7.1 R语言为Hadoop注入统计血脉
7.2 RHadoop安装与使用
7.3 RHadoop实验:统计邮箱出现次数
7.4 RHadoop实现基于MapReduce的协同过滤算法
7.5 rHBase安装与使用
7.6 解决RHadoop安装错误:PipeMapRed.waitOutputThreads()
第四部分 附录
附录A Java环境安装
A.1 Java在Windows中安装
A.2 Java在Linux Ubuntu中安装
附录B MySQL数据库安装
B.1 MySQL在Windows中安装
B.2 MySQL在Linux Ubuntu中安装
B.3 通过命令行客户端访问MySQL
B.4 修改MySQL服务器的配置
附录C Redis数据库安装
C.1 Redis在Windows中安装
C.2 Redis在Linux Ubuntu中安装
C.3 通过命令行客户端访问Redis
C.4 修改Redis的配置
附录D MongoDB数据库安装
D.1 MongoDB在Windows中安装
D.2 MongoDB在Linux Ubuntu中安装
D.3 通过命令行客户端访问MongoDB
附录E Cassandra数据库安装
E.1 在Ubuntu中环境准备
E.2 下载Cassandra软件包
E.3 配置Cassandra
E.4 设置环境变量
E.5 启动Cassandra服务器
E.6 用客户端访问cassandra
附录F Hadoop安装
F.1 在Ubuntu中环境准备
F.2 找到Hadoop历史版本
F.3 用源代码构建Hadoop环境
F.4 快速Hadoop配置环境脚本
F.5 为Windows环境编译hadoop-core.jar
附录G Hive环境安装
G.1 Hive的安装
附录H HBase安装
H.1 在Ubuntu中环境准备
H.2 HBase安装
H.3 Thrift安装
载入中