嵌套循环怎么加快运行速度

for i in range(8000):
        for j in range(10000):
            if bool(re.findall(a.loc[i, 'num'][:-3], b.loc[j, 'nums'])):   #判断是否包含字段
                if a.loc[i, 'num']==b.loc[j, 'nums']:  #字段名相同跳过
                    pass
                else:
                    ssn =a.loc[i, 'num'].split('_')    #以_分割字符串
                    a.loc[i, 'num'] = ssn[0] + '_' + ssn[1] + 'M_' + ssn[2] #为字段名相似的增加'M'

数据集a里面有8000条数据,数据集b里面有10000条数据,遍历这两个数据集中选出某列对比内容,想做的操作就是相似的增加一个字母。运行太慢了,已经用过numba的jit装饰器。还是慢,怎么加快,这种嵌套循环可以加线程提高运行速度吗?还是进程什么的,换成map这些的感觉太复杂,我自己想不明白怎么改,希望得到各位大能的指导。

你这样每次循环正则+ == 判断都会使用时间耗费太多。
转为多维数组,用pandas中内置的一些方法处理起来,效率会提升很多。

看看《计算机组成原理》? 数据交换之类的