机读格式显示(MARC)
- 000 01808cam0 2200397 450
- 010 __ |a 978-7-111-58855-9 |d CNY59.00
- 099 __ |a CAL 012018052450
- 100 __ |a 20180508d2018 em y0chiy50 ea
- 200 1_ |a 文本挖掘 |A wen ben wa jue |e 基于R语言的整洁工具 |f Julia Silge, David Robinson著 |g 刘波, 罗棻, 唐亮贵译
- 210 __ |a 北京 |c 机械工业出版社 |d 2018
- 215 __ |a 161页 |c 图 |d 24cm
- 306 __ |a 由O'Reilly Media, Inc.授权出版
- 314 __ |a 责任者Silge汉译姓: 斯拉格取自在版编目; 责任者Robinson规范汉译姓: 鲁滨逊
- 320 __ |a 有书目 (第160-161页)
- 330 __ |a 全书共9章,主要介绍如何使用基于R的整洁工具来进行文本分析。首先介绍了整洁文本的格式,以及如何获取整洁文本数据集;并通过tidytext中的情感数据集来进行情绪分析;接着介绍了如何根据tf-idf统计量来识别特定文档中的重要单词,以及如何利用n-gram来分析文本中的文字网络;之后介绍了如何将整洁文本转换为文档词项矩阵和Corpus对象格式,并给出了主题建模的概念;后通过整合多种已知的整洁文本挖掘方法,给出了一些研究案例,这些案例涉及Twitter归档文件、NASA数据集以及来自新闻组的即时通信信息。
- 500 10 |a Text mining with R : a tidy approach |A Text Mining With R : A Tidy Approach |m Chinese
- 517 1_ |a 基于R语言的整洁工具 |A ji yu R yu yan de zheng jie gong ju
- 606 0_ |a 程序语言 |A cheng xu yu yan |x 程序设计
- 701 _1 |a 斯拉格 |A si la ge |g (Silge, Julia) |4 著
- 701 _1 |a 鲁滨逊 |A lu bin xun |g (Robinson, David) |4 著
- 702 _0 |a 刘波 |A liu bo |4 译
- 702 _0 |a 罗棻 |A luo fen |4 译
- 702 _0 |a 唐亮贵 |A tang liang gui |4 译
- 801 _0 |a CN |b NMU |c 20180508
- 801 _2 |a CN |b PUL |c 20180607
- 905 __ |a JHUD |d TP312R/21