Hive大数据存储与处理
何煌 张良均
内容提要
本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容循序渐进、由浅入深。本书共8章,包括广电大数据用户画像需求分析、部署开发环境、广电用户数据存储、广电用户基本数据简单查询、广电用户账单与订单数据查询进阶、广电用户收视行为数据查询优化、广电用户数据清洗及数据导出,以及广电用户数据存储与处理的程序开发。本书大部分章包含实训和课后习题,通过练习和操作实践,帮助读者巩固所学的内容。
本书可以作为高等院校数据科学或大数据相关专业的教材,也可以作为大数据爱好者的自学用书。 大数据技术精品系列教材专家委员会
专家委员会主任:郝志峰(汕头大学)
专家委员会副主任(按姓氏笔画排列):
王其如(中山大学)
余明辉(广州番禺职业技术学院)
张良均(广东泰迪智能科技股份有限公司)
聂哲(深圳职业技术大学)
曾斌(人民邮电出版社有限公司)
蔡志杰(复旦大学)
专家委员会成员(按姓氏笔画排列):
王丹(国防科技大学) 王津(成都航空职业技术学院)
王爱红(贵州交通职业技术学院) 韦才敏(汕头大学)
化存才(云南师范大学) 方海涛(中国科学院)
孔原(江苏信息职业技术学院) 邓明华(北京大学)
史小英(西安航空职业技术学院) 冯伟贞(华南师范大学)
冯国灿(中山大学) 边馥萍(天津大学)
戎海武(佛山科学技术学院) 吕跃进(广西大学)
朱元国(南京理工大学) 朱文明(深圳信息职业技术学院)
任传贤(中山大学) 刘保东(山东大学)
刘彦姝(湖南大众传媒职业技术学院)
刘深泉(华南理工大学) 孙云龙(西南财经大学)
阳永生(长沙民政职业技术学院) 花强(河北大学)
杜恒(河南工业职业技术学院) 李明革(长春职业技术学院)
杨坦(华南师范大学) 杨虎(重庆大学)
杨志坚(武汉大学) 杨治辉(安徽财经大学)
肖刚(韩山师范学院) 吴孟达…