重复数据删除技术:面向大数据管理的缩减技术

付印金 肖侬
内容简介 本书是一本专门介绍重复数据删除技术的专业书籍。全书共分为8章,以大数据存储为背景,介绍重复数据删除的关键技术及其应用场景。通过学习本书,读者能够了解信息存储技术基础、大数据管理主流技术和高效能存储管理基本知识,并可以深入理解重复数据删除技术的概念、分类、存储原理及关键技术,还可掌握前沿的应用,如感知源端重删机制和高可扩展集群重删技术,了解主流厂商重删存储相关产品及其应用案例。 本书面向从事大数据存储系统设计及相关技术研究和开发工作的读者。既可以作为存储系统架构师、软件开发工程师、产品或项目经理、数据中心运维人员等的实用工具书,还可以作为普通高等院校计算机和大数据科学相关专业的教学或科研人员、研究生、高年级本科生及相关培训机构学员的学习参考书。 图片 付印金/博士 国防科学技术大学计算机学院博士、军事科学院系统工程研究院博士后,现为中国计算机学会高级会员、信息存储技术/系统软件专业委员会委员。长期从事网络存储、大数据管理与云计算方向的相关课题研究。主持完成国家自然科学基金、江苏省自然科学基金等课题,发表学术论文50多篇,申请和授权国家发明专利10余项。 图片 肖侬/博士 中山大学、国家超级计算广州中心教授、博士生导师,教育部长江学者特聘教授,获得国家杰出青年科学基金资助。现任CCF Fellow中国计算机学会大数据专家委员会副主任、信息存储技术专业委员会副主任。研究方向为网络计算与云计算、新型存储和系统结构,是我国高性能网络计算技术研究的先行开拓者之一。负责863重大项目和国家自然科学基金重点项目等课题,发表学术论文200多篇。 序言大数据时代数据量暴涨带来的问题 大数据时代,数据量呈直线上涨。5G时代的到来、各种AI技术的落地,都在加速数据量的暴涨,而暴涨的数据量带来的问题都有哪些呢? 1.数据存储成本的上升 由于诸多数据鱼龙混杂,数据分析提炼的速度赶不…