算出来的余弦值大于1
import xlrd
from math import pow
excle_file = r"我的文件地址"
data = xlrd.open_workbook(excle_file)
def get_unknow_centre(n): #矩阵中心化
table = data.sheet_by_name('Sheet3')
c = list(table.row_values(n-1))
sum_c = sum(c)
ave_c = sum_c/14
d = [x-ave_c for x in c]
return d
def get_know_centre(m):
table = data.sheet_by_name('Sheet3')
e = list(table.row_values(m-1))
sum_e = sum(e)
ave_e = sum_e/14
f = [x-ave_e for x in e]
return f
if __name__ == '__main__':
m = int(input('请输入对比到的行数:'))
n = int(input('请输入未知颜色的行数:'))
unknow_row_centre = get_unknow_centre(n)
know_row_centre = get_know_centre(m)
pow_unknow = pow((sum([w**2 for w in unknow_row_centre])),1/2)
pow_know = pow((sum([z**2 for z in know_row_centre ])),1/2)
Similarity = (sum([o*p for o in unknow_row_centre for p in know_row_centre if unknow_row_centre.index(o)==know_row_centre.index(p)]))/(pow_unknow * pow_know)
print(Similarity)
similarity值大于1 我想算的是两个向量的余弦值
余弦值正常
计算结果远大于1还是非常接近于1?如果是后者,我猜可能是浮点数累计误差造成的。计算向量余弦的算法,貌似是正确的,但代码有很多值得商榷之处,比如:
建议题主尝试一下numpy,更适合计算此类问题。以下是一个计算向量余弦的例子。
import math
import numpy as np
v1 = [1.5, 2.6, 3.7]
v2 = [-2.3, 3.5, -4.9]
m1 = np.linalg.norm(v1) # 计算向量v1的模(2范)
m2 = np.linalg.norm(v2) # 计算向量v2的模(2范)
similarity = np.dot(v1, v2) / (m1 * m2)
similarity
-0.40636485717113935
实现上看起来没什么问题,可以看看数据吗?或者给下similarity>1的两个向量看看