python DataFrame

张金荣的Python程序设计与数据分析
为什么d2008_1真的出错了,取到了mod==0的数据。

img


需要用到一个文件"deaths.xlsx"
https://pan.baidu.com/s/13s2AMwqEoR1-Jse15b86gA
提取码c66t

以下是正确的代码d2008

import pandas as pd
import numpy as np
deaths=pd.read_excel('deaths.xlsx',index_col=0)
#d2008_1=deaths[(deaths.yod==2008)&(deaths.dod!=0) &(deaths.mod!=0)].dropna()
d2008=deaths[(deaths.yod==2008)&(deaths['dod'].ne(0))&(deaths['mod'].ne(0))].dropna()
print(d2008.head(10))
print(d2008.shape)

运行结果为

img

以下是出问题的代码d2008_1

import pandas as pd
import numpy as np
deaths=pd.read_excel('deaths.xlsx',index_col=0)
d2008_1=deaths[(deaths.yod==2008)&(deaths.dod!=0) &(deaths.mod!=0)].dropna()
#d2008=deaths[(deaths.yod==2008)&(deaths['dod'].ne(0))&(deaths['mod'].ne(0))].dropna()
print(d2008_1.head(10))
print(d2008_1.shape)

运行结果为

img

可以看到出错了,mod为0的数据没有被筛选出去。
关键点在于这两行代码的区别

d2008=deaths[(deaths.yod==2008)&(deaths['dod'].ne(0))&(deaths['mod'].ne(0))].dropna()
d2008_1=deaths[(deaths.yod==2008)&(deaths.dod!=0) &(deaths.mod!=0)].dropna()

估计问题出在这了,判断不等于0所用的对象

img


可以看到两种访问方式所得到的结果是不同的

img


我尝试判断0是否可以和它们比较

img


结果报错:类型“方法”的参数不可迭代
接下来尝试另一个

img


可以进行比较
答案呼之欲出了,虽然我用in函数感觉不太严谨,但就是那个意思,.和[ ]所得出的对象是不同类型的。

谁能敲代码呀,还是把自己的代码发上来吧