import pandas as pd
df = pd.DataFrame([[240.88, 242.46, 241.27], [241.82, 242.44, 241.32], [241.76, 241.92, 241.14], [241.84, 241.64, 241.07], [241.48, 241.64, 241.07]])
df.columns = ['A', 'B', 'C']
print(df)
A B C
0 240.88 242.46 241.27
1 241.82 242.44 241.32
2 241.76 241.92 241.14
3 241.84 241.64 241.07
4 241.48 241.64 241.07
需要增加一列D,如果A列的值>B列的值,则D列值为1,如果A列值<C列值,D列值为-1,若A列值在B、C两列之间,则为0
请问大家除了一行一行判断,有没有直接用df['D']= 这样的语句直接实现的办法
用apply 和 lambda 实现
import pandas as pd
def check_data(x):
if x[0]>x[1]:
return 1
elif x[0]<x[2]:
return -1
else:
return 0
df = pd.DataFrame([[240.88, 242.46, 241.27], [241.82, 242.44, 241.32], [241.76, 241.92, 241.14], [241.84, 241.64, 241.07], [241.48, 241.64, 241.07]])
df.columns = ['A', 'B', 'C']
df['D'] = df.apply(lambda x:check_data(x), axis=1)
print(df)