Hive大数据存储与处理

何煌 张良均
内容提要 本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容循序渐进、由浅入深。本书共8章,包括广电大数据用户画像需求分析、部署开发环境、广电用户数据存储、广电用户基本数据简单查询、广电用户账单与订单数据查询进阶、广电用户收视行为数据查询优化、广电用户数据清洗及数据导出,以及广电用户数据存储与处理的程序开发。本书大部分章包含实训和课后习题,通过练习和操作实践,帮助读者巩固所学的内容。 本书可以作为高等院校数据科学或大数据相关专业的教材,也可以作为大数据爱好者的自学用书。 大数据技术精品系列教材专家委员会 专家委员会主任:郝志峰(汕头大学) 专家委员会副主任(按姓氏笔画排列): 王其如(中山大学) 余明辉(广州番禺职业技术学院) 张良均(广东泰迪智能科技股份有限公司) 聂哲(深圳职业技术大学) 曾斌(人民邮电出版社有限公司) 蔡志杰(复旦大学) 专家委员会成员(按姓氏笔画排列): 王丹(国防科技大学) 王津(成都航空职业技术学院) 王爱红(贵州交通职业技术学院) 韦才敏(汕头大学) 化存才(云南师范大学) 方海涛(中国科学院) 孔原(江苏信息职业技术学院) 邓明华(北京大学) 史小英(西安航空职业技术学院) 冯伟贞(华南师范大学) 冯国灿(中山大学) 边馥萍(天津大学) 戎海武(佛山科学技术学院) 吕跃进(广西大学) 朱元国(南京理工大学) 朱文明(深圳信息职业技术学院) 任传贤(中山大学) 刘保东(山东大学) 刘彦姝(湖南大众传媒职业技术学院) 刘深泉(华南理工大学) 孙云龙(西南财经大学) 阳永生(长沙民政职业技术学院) 花强(河北大学) 杜恒(河南工业职业技术学院) 李明革(长春职业技术学院) 杨坦(华南师范大学) 杨虎(重庆大学) 杨志坚(武汉大学) 杨治辉(安徽财经大学) 肖刚(韩山师范学院) 吴孟达…