如何使用Python或C++处理大规模的数据(十亿个点的随机游走模拟)

具体问题是一个随机漫游的问题,十亿个点,需要进行10的15次方次随机漫游,算法本身不难,但如何用C++或者Python处理这些数据,毕竟太多了
尝试直接用Python的Numpy数组直接处理,发现不太可行,10的6次方就已经需要很久了

1.使用大数据工具,spark。
2.在python中指定数据类型,类似C语言编程风格。
3.XENO服务器加内存条扩展,只要硬件够强,没有解决不了的问题。

这个数据量也太大了吧,算下来要超过10^25次的运算,假设你用超级计算机,10^16次运算/秒,也要算,每秒钟也只能漫游100万次漫游,10^15次要算10^9秒,也就是差不多32年能漫游完。