新浪博客

【T】距离(2)--类之间距离的度量方法

2014-08-19 16:49阅读:
该博文已整理到新地址:
http://qinqianshan.com/class_distantce_metrics/
系统聚类法不仅需要度量个体与个体之间的距离,还要度量类与类之间的距离。类间距
离被度量出来之后,距离最小的两个小类将首先被合并成为一类。由类间距离定义的不同产
生了不同的系统聚类法。SPSS 中提供了如下几种类间距离测度方法:
组间平均连接距离Between-group linkage):以两类个体两两之间距离的平均数作
为类间距离;
组内平均连接距离Within-group linkage):将两类个体合并为一类后,以合并后
类中所有个体之间的平均距离作为类间距离;
最近邻距离Nearest neighbor):以两类中距离最近的两个个体之间的距离作为类
间距离;
最远邻距离
Furthest neighbor):以两类中距离最远的两个个体之间的距离作为类
间距离;
重心距离Centroid cluster):以两类变量均值之间的距离作为类间距离;
中位数距离Median cluster):以两类变量中位数之间的距离作为类间距离;
离差平方和法(Ward method): 该方法是Ward提出来的,所以又称为Ward法。具
体做法是先将n个样品各自成一类,然后每次减少一类,随着类与类的不断聚合,
类内的离差平方和必然不断增大,选择使离差平方和增加最小的两类合并,直到所
有的样品归为一类为止。


参考资料:
10 聚类分析超级赞的一个资料http://pan.baidu.com/s/1eQzknXC

我的更多文章

下载客户端阅读体验更佳

APP专享