情况如下:
我们每个月月底都会加载一部分数据到galera集群,而且这些文件基本上都是2~5G
左右,我们采用“insert into 正式表 select * from 临时表;”会出现记录数无法提
提交的情况,估计是由于提交的量比较大。然后我们使用工具分批导入的时候,发现一个3.5G的文件会消耗接近2个小时才可以入库,请问各位大拿有什么好的优化方法,谢谢?
要对症下药啊,导入的时候,先要查看一下是哪里慢了,IO?
是日志写入慢了?
刷脏慢了?
double write的时候慢了?
undo history list 过长?
等等。
要先找到问题,然后才能解决问题。