MARC状态:审校 文献类型:中文图书 浏览次数:49
- 题名/责任者:
- 数据清洗基础与实践/主编谢东亮, 黄天春
- 出版发行项:
- 西安:西安电子科技大学出版社,2019
- ISBN及定价:
- 978-7-5606-5460-7/CNY22.00
- 载体形态项:
- 130页:图;26cm
- 丛编项:
- 高等学校大数据系列教材
- 个人责任者:
- 谢东亮 主编
- 个人责任者:
- 黄天春 主编
- 学科主题:
- 数据处理-高等学校-教材
- 中图法分类号:
- TP274
- 提要文摘附注:
- 本书分为两篇,共九章,系统地讲解了数据清洗的理论与实践。第一篇为基础篇,其中第一章介绍数据清洗的基本概念、数据标准化以及数据仓库的概念等;第二章介绍数据格式类型与数据编码,从文件以及文本的格式、文档的归档与压缩、字符编码与数据转换方面做了介绍;第三章对最常用的文本与电子表格数据清洗做了介绍;第四章介绍了数据清洗的基本技术、方法与工具;第五章从文本、Web文件、数据库数据的抽取方面做了介绍;第六章介绍了数据的转换与加载和数据的质量评估。第二篇为实战篇,其中第七章介绍了五种常用的数据清洗工具;第八章专门讲解了如何对Web的数据进行采集及预处理;第九章介绍了从RDBMS数据源中获取数据及进行数据的脱敏、清洗等操作。
全部MARC细节信息>>