python利用pandas,numpy等常用库修改数据

python利用pandas,numpy等常用库将white_train.csv中quality一列的值按照大于5为1,否则为0重新写入。如quality为9,则将9改写为1,quality为5,则将5改写为0。

df = pd.read_csv( 'test.csv', encoding='utf-8')
df['quality'] = df['quality'].map(lambda x: 1 if x > 5 else 0)
df.to_csv( 'test.csv', index=False)

使用pandas的apply函数,这样写即可 :

import pandas as pd
df=pd.DataFrame({'quality':[3,7,5,6,2,1,9]})
df['quality']=df['quality'].apply(lambda x:1 if x >5 else 0)
print(df)