DBSCAN聚类是不是只能做两个变量或者三个变量的,那种七八个变量的可以做吗?
不知道你这个问题是否已经解决, 如果还没有解决的话:层次聚类主要有两种类型:合并的层次聚类和分裂的层次聚类。
合并的层次聚类是一种自底向上的层次聚类算法,从最底层开始,每一次通过合并最相似的聚类来形成上一层次中的聚类,整个当全部数据点都合并到一个聚类的时候停止或者达到某个终止条件而结束,大部分层次聚类都是采用这种方法处理。
分裂的层次聚类是采用自顶向下的方法,从一个包含全部数据点的聚类开始,然后把根节点分裂为一些子聚类,每个子聚类再递归地继续往下分裂,直到出现只包含一个数据点的单节点聚类出现,即每个聚类中仅包含一个数据点。
主要算法:BIRCH算法、CURE算法、CHAMELEON算法。
优点:可解释性好;可以解决K-means不能解决的非球形族。
缺点:时间复杂度高。