spark版本2.3。distribute by cast(rand()*400 as int)应该生成400个文件。当前只有255个文件,多次执行结果一样,想知道是什么原因(partition的数量也是400,executors数100,executor core数4)
传不同 seed 试试,rand(seed)