
Calcite数据管理实战
大数据技术丛书
¥57.54
加载中,请稍候……
作品简介
Calcite是一款开源的动态数据管理框架,其目标是一种方案适应所有需求场景,能为不同计算平台和数据源提供统一的查询引擎,它对于没有高并发、低延时的多数据源间的数据管理有着天然的优势,是解决多数据源统一管理问题的利器。本书围绕Calcite,结合其数据库基础知识、核心理论以及相关的项目实践情况,从SQL的解析、校验、优化、执行等流程,对Calcite组件进行介绍。同时本书为部分章节配置对应的代码和实例,帮助读者加深理解。本书内容由理论到实践,将源码解析与实际案例相结合,可以作为Calcite新手的入门图书以及快速上手的参考书,也可以作为大数据开发人员和从业人员的学习用书,还可以作为相关培训机构以及高等院校的教学用书。
刘钧文,哈尔滨工业大学硕士,京东科技算法工程师,中国计算机学会(CCF)会员。负责京东时空数据引擎的开发、时空数据产品的研发工作。研究方向:时空数据的管理、时空数据库、数据库优化器的原理及其实现、分布式计算以及城市计算。
悟初境,京东科技软件开发工程师。负责京东时空数据引擎的开发,多项时空数据产品的主要参与者,并在多个项目中负责架构设计的工作。研究方向:数据库原理和实现,大数据与架构设计。
孙潇俊,北京工业大学软件工程硕士,曾任京东科技大数据开发工程师。负责京东时空数据引擎的开发。研究方向:数据库优化器的原理及其实现。
作品目录
推荐辞
序 一
序 二
前 言
为什么要写这样一本书
内容导读
致谢
资源与支持
配套资源
提交勘误
与我们联系
关于异步社区和异步图书
第1章 Calcite的前世今生
1.1 数据管理系统的发展历史
1.2 当前数据管理系统的困境
1.3 Calcite简史
1.4 Calcite生态系统
1.5 为什么使用Calcite
1.6 本章小结
第2章 Calcite架构概述
2.1 设计思想
2.2 整体架构
2.3 使用方式
2.4 核心特性
2.5 执行流程
2.6 本章小结
第3章 Calcite快速上手
3.1 下载、编译和运行
3.2 SQLLine操作方法
3.3 集成CSV文件开发实例
3.4 本章小结
第4章 数据库查询优化技术
4.1 什么是数据库查询优化技术
4.2 查询优化器的内外结构
4.3 逻辑计划优化
4.4 物理计划优化
4.5 优化模型
4.6 本章小结
第5章 服务层
5.1 Avatica架构介绍
5.2 Avatica执行结构和流程
5.3 Avatica鉴权
5.4 客户端驱动
5.5 命令行工具
5.6 本章小结
第6章 解析层
6.1 语法解析过程
6.2 Calcite中的解析体系
6.3 JavaCC
6.4 Calcite整合Antlr方法
6.5 Antlr对比JavaCC
6.6 本章小结
第7章 校验层
7.1 何谓校验
7.2 元数据定义
7.3 校验流程
7.4 元数据DDL
7.5 本章小结
第8章 优化层
8.1 关系代数与火山模型
8.2 优化器
8.3 Calcite优化器
8.4 自定义优化规则
8.5 本章小结
第9章 数据源接入
9.1 Redis
9.2 PostgreSQL
9.3 Janino介绍
9.4 本章小结
第10章 SQL函数扩展
10.1 UDF
10.2 UDAF
10.3 UDTF
10.4 执行流程
10.5 本章小结
第11章 空间数据查询
11.1 OGC简介
11.2 空间数据类型
11.3 空间函数
11.4 使用方法
11.5 自定义空间函数
11.6 本章小结
第12章 流式处理
12.1 流式查询简介
12.2 流式查询初体验
12.3 流式聚合查询
12.4 本章小结
第13章 视 图
13.1 普通视图
13.2 物化视图
13.3 格
13.4 本章小结
第14章 Calcite在开源项目中的使用
14.1 Hive
14.2 Kylin
14.3 Flink
14.4 本章小结