数据挖掘功能包括发现概念/类描述、关联、分类、预测、聚类、趋势分析、偏差分析和类似性分析。特征化和区分是数据汇总的形式。
数据分类(data classification)是一个两步过程:1)建立一个模型,描述预定的数据类集或概念集。通过分析由属性描述的数据库元组来构造模型。2)使用模型进行分类。
“预测和分类有何不同?”预测(prediction)是构造和使用模型评估无标号样本类,或评估给定样本可能具有的属性值或值区间。在这种观点下,分类和回归是两类主要预测问题,其中分类是预测离散或标称值,而回归用于预测连续或有序值。然而,我们的观点是:用预测法预测类标号为分类,用预测法预测连续值(例如使用回归方法)为预测。这种观点在数据挖掘界被广泛接受。
7.3用判断树归纳分类
判断树(decision tree)是一个类似流程图的树结构,气质每个内部节点表示在一个属性上的测试,每个分支代表一个测试输出,而每个树叶节点代表类或者类分布。
chp8 聚类分析
将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。
聚类的方法有:
1)划分方法 partitioning method
2)层次方法hierarchical method
3)基于密度的方法 density-based method
4)基于网格的方法grid-based method
5)基于模型的方法model-based method
note for 数据挖掘-概念与技术
《数据挖掘概念与技术》热门书评
-
与这本书相关的视频
87有用 2无用 Welf 2009-06-05
浙大的王灿老师的讲课视频:http://www.businessanalysis.cn/viewthread.php?tid=13320&extra=&page=1韩家炜自己的讲课视频:http://v.youku.com/v_playlist/ct250f1903290o1p0...
-
推荐几个数据分析网站
32有用 0无用 corn 2014-03-27
推荐几个数据分析网站 随着数据的数量级增长,促进了数据分析的火热。但很多数据分析从业人员却感觉没有很好的获取行业资讯、技术交流的平台,今天就推荐几个经常上的觉得很不错的网站给大家。...
-
很好的分类学习入门书
20有用 0无用 大饼 2009-04-12
这本书虽然标题是Data Mining,但是核心内容还是机器学习。我理解“数据挖掘”主要指的还是KDD,即基于数据库的知识发现。在这个领域,基本的方法是聚类和关联规则发现;而在机器学习领域,主要研究的是分类。这本书的内容主要是分类,也有一部分聚类的内容,关联规则发现基本上没有讲。但它对分类讲的很详细...
-
不见得最好,却经典
19有用 2无用 豆萁 2006-11-29
应该说这部书可以把人引进门,但看了之后,总觉得还有些概念模糊之处,比如说数据挖掘的理论来源是什么?如何把这些算法从本质上分类? 我觉得,这方面,《实用数据挖掘》会更好些。另外,如何使用简单的软件,为企业或政府部门实现一个简单可见的数据挖掘呢?这方面,我只读过《可视化数据挖掘》...
-
致力于挖掘体系的构建,而非某个算法!~
7有用 2无用 Palmer 2011-03-25
对于刚入门数据挖掘的人来说,这书绝对会让你感觉自己是个折翼的天使。,因为一开始就各种各样的理论扑面而来,而对于那些经典的算法却只是做一个感性的介绍,并没有那种流程图式的清晰解说。总之就是,不易上手。 &nb...