
重复数据删除技术:面向大数据管理的缩减技术
作品简介
本书面向从事大数据存储系统设计及相关技术研究和开发工作的读者。既可以作为存储系统架构师、软件开发工程师、产品或项目经理、数据中心运维人员等的实用工具书,还可以作为普通高等院校计算机和大数据科学相关专业的教学或科研人员、研究生、高年级本科生及相关培训机构学员的学习参考书。
付印金博士
军事科学院系统工程研究院博士后、陆军工程大学讲师,现为中国计算机学会高级会员、信息存储技术/系统软件专业委员会委员。长期从事网络存储、大数据管理与云计算方向的课题研究。已主持完成国家自然科学基金、江苏省自然科学基金等课题多项,发表学术论文50多篇,申请和授权国家发明专利10余项。主讲过“计算机组成原理”、“计算机网络”与“云计算”等本科与研究生专业课程。
肖侬教授
中山大学国家超算计算广州中心教授、博士生导师,国防科技大学教授。获得教育部长江学者特聘教授、国家杰出青年科学基金资助。现任CCF Fellow、中国计算机学会大数据专家委员会副主任、信息存储技术专业委员会副主任。研究方向为网络计算与云计算、新型存储和系统结构,是我国高性能网络计算技术研究的先行开拓者之一。负责过863重大项目和国家自然科学基金重点项目等课题,发表学术论文200多篇。
作品目录
内容简介
序言大数据时代数据量暴涨带来的问题
1.数据存储成本的上升
2.数据访问的性能与成本没有成比例上升
3.数据安全问题
前言
创作背景
致谢那些帮助过我的人和组织
联系作者/联系书友
第1章 概述
1.1 大数据简介
1.2 高效能存储管理
1.3 本章小结
参考文献
第2章 存储技术基础
2.1 存储介质
2.2 存储接口
2.3 存储系统架构
2.4 网络存储系统
2.5 本章小结
参考文献
第3章 大数据管理技术
3.1 分布式计算框架
3.2 分布式文件系统
3.3 NoSQL数据库
3.4 大数据仓库
3.5 本章小结
参考文献
第4章 重复数据删除存储系统
4.1 重复数据删除的概念及分类
4.2 重复数据删除存储原理
4.3 重复数据删除技术应用场景
4.4 相关产品及开源项目
4.5 本章小结
参考文献
第5章 重复数据删除关键技术
5.1 数据划分方法
5.2 块索引查询优化技术
5.3 可扩展数据路由技术
5.4 块指纹计算加速方法
5.5 数据还原方法
5.6 垃圾回收技术
5.7 高可靠数据配置策略
5.8 数据安全技术
5.9 本章小结
参考文献
第6章 应用感知源端重复数据删除机制
6.1 研究背景
6.2 相关研究工作
6.3 基本形式化模型
6.4 研究动机
6.5 高效应用感知源端重复数据删除的设计与实现
6.6 实验评估
6.7 本章小结
参考文献
第7章 高可扩展集群重复数据删除技术
7.1 研究背景
7.2 相关研究工作
7.3 基本模型与算法
7.4 系统设计与实现
7.5 性能评估
7.6 本章小结
参考文献
第8章 重复数据删除存储案例分析
8.1 重复数据删除缩减率评估
8.2 主流厂商相关产品应用案例
8.3 本章小结
参考文献