python求多维向量余弦值

问题遇到的现象和发生背景

算出来的余弦值大于1

用代码块功能插入代码,请勿粘贴截图
import xlrd
from math import pow

excle_file = r"我的文件地址"

data = xlrd.open_workbook(excle_file)

def get_unknow_centre(n):   #矩阵中心化

    table = data.sheet_by_name('Sheet3')

    c = list(table.row_values(n-1))

    sum_c = sum(c)

    ave_c = sum_c/14

    d = [x-ave_c for x in c]

    return d

def get_know_centre(m):

    table = data.sheet_by_name('Sheet3')

    e = list(table.row_values(m-1))

    sum_e = sum(e)

    ave_e = sum_e/14

    f = [x-ave_e for x in e]

    return  f



if __name__ == '__main__':

    m = int(input('请输入对比到的行数:'))
    
    n = int(input('请输入未知颜色的行数:'))



    unknow_row_centre = get_unknow_centre(n)

    know_row_centre = get_know_centre(m)

    pow_unknow = pow((sum([w**2 for w in unknow_row_centre])),1/2)

    pow_know = pow((sum([z**2 for z in know_row_centre ])),1/2)
    
    Similarity = (sum([o*p for o in unknow_row_centre for p in know_row_centre if unknow_row_centre.index(o)==know_row_centre.index(p)]))/(pow_unknow * pow_know)

    print(Similarity)

运行结果及报错内容

similarity值大于1 我想算的是两个向量的余弦值

我想要达到的结果

余弦值正常

计算结果远大于1还是非常接近于1?如果是后者,我猜可能是浮点数累计误差造成的。计算向量余弦的算法,貌似是正确的,但代码有很多值得商榷之处,比如:

  1. python内置pow函数,无需从math导入;
  2. python内置sun函数,精度低于math.fsum函数;
  3. 自定义的get_unknow_centre函数和get_know_centre函数应该是完全一样的吧?
  4. 向量点乘无需嵌套循环,使用zip函数一次循环即可。

建议题主尝试一下numpy,更适合计算此类问题。以下是一个计算向量余弦的例子。

import math
import numpy as np
v1 = [1.5, 2.6, 3.7]
v2 = [-2.3, 3.5, -4.9]
m1 = np.linalg.norm(v1) # 计算向量v1的模(2范)
m2 = np.linalg.norm(v2) # 计算向量v2的模(2范)
similarity = np.dot(v1, v2) / (m1 * m2)
similarity
-0.40636485717113935

实现上看起来没什么问题,可以看看数据吗?或者给下similarity>1的两个向量看看