数据集:Kaggle的titanic的数据
问题:为什么用np.nan 填充Age的平均值后,Age列还是有空值?但是用isnull()来替换,就可以全部替换成功。
np.nan 和isnull() 有什么区别,为什么会有这样的不同?
data[data["Age"]==np.nan]=data["Age"].mean()
data.info()
实际上这个属于numpy的设计观念,np.nan和np.nan均为缺失值,但二者不一定相等,用==比较总会返回False,可用np.isnan()或is判断某值是否为np.nan