对于第一个数据集,使用 DBSCAN 聚类得到的结果如下(邻域参数为 (eps=1, min_samples=4)):
Cluster 0: {x1, x3, x4, x5, x6, x7, x8, x9, x10, x11}
Cluster 1: {x2}
Cluster 2: {x12}
Cluster 3: {x13}
Cluster 4: {x14, x15}
对于第二个数据集,使用 AGNES 算法并可视化曼哈顿距离的树状图可以发现在 2-3 处划分是最符合情理的,所以将其划分为两个簇。使用单链接或全链接方法划分两个簇的结果如下:
单链接
Cluster 1: {x1, x2, x4}
Cluster 2: {x3, x5, x6, x7, x8}
Cluster 3: {x9, x10}
Cluster 4: {x11, x12, x13, x14, x15}
全链接
Cluster 1: {x2, x4, x5}
Cluster 2: {x1, x3, x6, x7, x8}
Cluster 3: {x9, x10}
Cluster 4: {x11, x12, x13, x14, x15}