数据整理实践指南

作者[美] 麦卡伦

译者魏秀丽李芳妹

类别出版 / 非虚构

出版社人民邮电出版社 / 2016-05

提供方人民邮电出版社

字数约 137,000 字

ISBN9787115411020

暂无评价综合评分的显示会考虑用户真实性等多项因素，每部作品出现综合评分的时间不定。

开通会员，可免费在线阅读本书，首月特惠去开通

全本定价￥31.36

作品简介

随着数据科学的热门，数据的优化、整理以及如何处理不良数据成为人们关注的重点。本书通过处理不良数据，进行数据清理的案例，向读者展示了处理数据的方法。

本书共有19章，从6部分向读者展示了使用和清理不良数据背后的理论和实践。第1部分是Grubby的动手实践指南，它向读者介绍了驾驭、提取数据的方法，如何处理文本数据中的数据以及Web开发中碰到的数据问题。第2部分是让人充满意外的数据，它向读者介绍了数据也会“撒谎”。第3部分是方法，它向读者介绍了处理不良数据的一些方法。第4部分是数据存储和基础设施，它向读者介绍了如何存储数据。第5部分是数据的商业化，它向读者介绍了如何避免数据处理的一些误差。第6部分是数据策略，它向读者介绍了如何追踪数据、评估数据质量以及构建数据质量相关平台等。

本书适合数据科学家、数据处理和整理相关开发人员阅读。也适合想要进入数据处理领域的读者阅读。

Q．Ethan McCallum，是一位顾问、作家，也是一名科技爱好者。他帮助很多公司在数据和技术方面做出明智的决策，他为The O’Relly Network 和Java.net撰写文章，并且为《C/C++Users Journal》《Doctor Dobb’s Journal》和《Linux Magazine》撰稿。

数据整理实践指南

作品简介

作品目录