cache line填充后运行时间问题

#include
#include

int main(int argc,char* argv[])
{
int len = 64*1024*1024;
int K =atoi(argv[1]);
int arr = (int)malloc(sizeof(int)*len);
int i;
for(i=0;i<len;i+=K)
{
arr[i]*=3;
}
return 0;
}

 按照http://blog.csdn.net/cool_way/article/details/41855595这篇文章说法,K的取值只有在
 16到32,64等64字节处 时间才会发生越变,可是我在Ubuntu上测试的结果却完全不同
 在1和2和4间变化较快,到了后面基本不变,这是什么原因,希望各位大牛解读

不同的处理器缓存的大小、速度、架构、层次、结合性、缓存淘汰算法是不同的,作者只是根据他的处理器的经验写的,没有普遍性。