在python中的sklearn包中实现文本聚类时,kmeans、BIRCH等算法,采用的都是欧式距离,如何进行修改为余弦距离
不知道你解决了没有,这个应该是很简单的。你说的余弦距离是不是余弦相似度呢?余弦相似度其实就是两个向量之间夹角的余弦值,两个向量越相似,夹角越小,相应的余弦相似度也越大。需要注意的一点是求cos一定要先做一步归一化处理,确保所有向量处于同一个层面。具体的程序题主应该是很容易就能写出来。