计算文本相关度,余弦定理和距离有什么不同,KNN为什么不用余弦定理而应用欧式距离?
余弦定理是衡量三个点之间的关系,距离是衡量两个点之间平面长度。欧几里得距离衡量的是多维空间中各个点之间的绝对距离。所以无论是多少个文本对比,维度再多,欧几里得距离都能计算出差异。但是余弦和距离局限就很大了。所以这就是为什么在数据挖掘中很多算法都是用欧几里得距离