由于csv文件存在多个重复列名,read_csv读取时会自动修改,怎么在写入的时候仍旧写入原来的列名

列名举例:[a,b,b,b]
读取时会变成[a,b.1,b.2,b.3]
写入的时候想要原列名[a,b,b,b]怎么办

数据大概十几万列的样子吧,重复的超过十万

在使用 pandas 库的 read_csv 函数读取具有重复列名的 CSV 文件时,可以通过设置 mangle_dupe_cols 参数为 False 来保留原始的列名。然后,将保留的列名作为参数传递给 to_csv 函数,以确保写入时使用原始的列名。

import pandas as pd

# 读取具有重复列名的 CSV 文件,并保留原始列名
df = pd.read_csv('your_file.csv', mangle_dupe_cols=False)

# 进行需要的操作...

# 写入时使用原始列名
df.to_csv('output_file.csv', index=False, header=list(df.columns))