MARC状态:审校 文献类型:中文图书 浏览次数:26
- 题名/责任者:
- 基于机器学习算法的分类知识发现及其在文本分析中的应用/祁瑞华著
- 出版发行项:
- 北京:清华大学出版社,2015
- ISBN及定价:
- 978-7-302-41576-3/CNY39.00
- 载体形态项:
- 178页:图;23cm
- 个人责任者:
- 祁瑞华 著
- 学科主题:
- 数据处理
- 中图法分类号:
- TP274
- 书目附注:
- 有书目 (第165-178页)。
- 提要文摘附注:
- 本书随着数据获取技术的不断发展和电子商务的广泛应用,各种信息正以前所未有的速度日益积累,高效率地分析信息海洋中的大量数据已经成为商业领域、工程领域和科学领域的共同需要。文本挖掘是数据挖掘领域的一个分支,与数据挖掘假设数据源是结构化数据集相比,文本挖掘的对象是非结构化或是半结构化的文本集合,需要从以文件形式存储的文本中提取和分析特征。不完整数据处理是现实世界中分类知识挖掘必须认真考虑和对待的重要问题。本书探讨了不完整数据分类算法的改进及其在文体风格识别中的应用,并基于缺失补偿策略最大熵模型对文本分类算法改进进行了探索性的研究。
全部MARC细节信息>>