|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
打开Matlab输入doc dendrogram,可以发现如下描述:
- ~8 I2 N* p( U' Q7 j: `
1 D0 Q0 x8 ?% n7 q; U; W/ c- s2 K- Y
% R. C2 i1 m" O" {
% q1 V$ g# A) \) @$ R( r: [6 Q- dendrogram(tree) generates a dendrogram plot of the hierarchical binary cluster tree. A dendrogram consists of many U-shaped lines that connect data points in a hierarchical tree. The height of each U represents the distance between the two data points being connected.
- If there are 30 or fewer data points in the original data set, then each leaf in the dendrogram corresponds to one data point.
- If there are more than 30 data points, then dendrogram collapses lower branches so that there are 30 leaf nodes. As a result, some leaves in the plot correspond to more than one data point.
" I+ a \, C5 `% Q
& x0 O; Q4 \# t3 z- W2 m
& g% v5 _% T( T4 k9 Q- [根据参考文献的思路,可能下面的说法更加好理解一些。7 o) Q9 u3 h1 @* n4 C: }4 W6 |
8 @3 N! d: B+ I7 V& h; [
在教材P301页0 L2 T7 N3 V- o7 G" Q* T
1)H=dendrogram(Z); m% s5 J5 ~6 v. H* o
有这么一句话,“当原始数据中观测数多于30个时,整个树形图会显得比较拥挤,可能会忽略某些底层节点,也就是说此时树形图中的某个叶节点可能对应多个观测。”
8 r' H$ u$ K6 i: }0 A- i 请问,可能会忽略某些底层节点是什么意思啊?某个叶节点可能对应多个观测又是什么意思呢?
3 G. U( g# k, D3 a0 M 还有这里的底层节点和叶节点分别是什么意思啊?
: L2 X' ~$ E2 O: L* ]+ `2)H=dendrogram(Z,P); P6 D7 @4 y; f8 A
若P为正整数,并且原始数据中的观测数多于P个时,将忽略某些底层节点,使得树形图的叶节点不多于P个。若P为0,则显示全部节点,此时树形图可能会显得比较拥挤。
/ i( ^" l6 d8 N4 [; p
6 m- {) }" s" X2 ~# k聚类树形图上显示(注意是显示出来的)的最底层称为叶节点,当观测数目不太多时,聚类树形图能显示所有观测,此时叶节点就是各个观测;当观测过多时,聚类树形图无法显示所有观测点,也就是说某些细节会被掩盖,换句话说就是某些细小的树枝(由某些观测构成的一个小树枝)会显示为一个叶节点,此时某个叶节点可能对应多个观测。
7 {2 k. p: l& Q4 [( F$ U; E9 w7 w
) @; F8 `; _3 d/ q' z: }! c
$ }2 m2 s# q: [2 L+ i4 A7 O |
|