csv文件任意选取6列

在做特征重要性分析,有十个相关的物理特征(也就是csv文件中列名),想任意选取其中六个,所有可能要包含,有什么相关函数吗

随机打乱列名,取前6列

使用shuffle函数打乱0~9,然后取前六个

不建议任意选取,可以删除相关性冗余特征,大概思路主要就是先使用pandas correlation函数进行相关性分析,然后比如a、b相关性很强,保留其中一个。