机读格式显示(MARC)
- 010 __ |a 978-7-307-21514-6 |d CNY38.00
- 099 __ |a CAL 012020357578
- 100 __ |a 20200921d2020 em y0chiy50 ea
- 200 1_ |a 大数据处理 |A da shu ju chu li |e 从采集到可视化 |f 余肖生, 陈鹏, 姜艳静编著
- 210 __ |a 武汉 |c 武汉大学出版社 |d 2020
- 215 __ |a 215页 |c 图 |d 24cm
- 225 2_ |a 高等学校信息管理学专业系列教材 |A gao deng xue xiao xin xi guan li xue zhuan ye xi lie jiao cai
- 330 __ |a 本书共分为9章, 第一章数据采集, 主要介绍了大数据的概念、类型及其特征, 常见的数据采集方法 ; 第2章数据清洗, 主要讨论数据质量的维度, 数据可能存在的质量问题, 常见的数据清洗方法 ; 第3章数据ETL, 重点介绍了MGO方法 ; 第4章数据存储, 主要介绍了大数据时代的一些主流数据存储平台和相关技术 ; 第5章回归算法, 主要介绍了线性回归、决策树回归、随机森林回归等, 并介绍了其实现的主要步骤以及相应的Python语言实现代码 ; 第6章分类算法, 主要介绍了逻辑回归二分类和多分类、度提升分类树等 ; 第7章聚类算法, 主要介绍了分割聚类、层次聚类、基于密度的聚类 ; 第8章推荐算法, 主要介绍了基于关联规则的推荐、基于内容过滤的推荐等主流方法 ; 第9章数据可视化的关键技术, 主要介绍了数据的降维、可视化隐喻及相关的交互技术。
- 410 _0 |1 2001 |a 高等学校信息管理学专业系列教材
- 517 1_ |a 从采集到可视化 |A cong cai ji dao ke shi hua
- 606 0_ |a 数据处理 |A shu ju chu li |x 高等学校 |j 教材
- 701 _0 |a 余肖生 |A yu xiao sheng |4 编著
- 701 _0 |a 陈鹏 |A chen peng |4 编著
- 701 _0 |a 姜艳静 |A jiang yan jing |4 编著
- 801 _0 |a CN |b 人天书店 |c 20200921
- 905 __ |a JHUD |d TP274/600