机器学习数据缺失值处理

img


目标值是最后一列 分为0和1 怎样才能分别处理缺失值呢?把目标值分离开来 然后分别计算 0的数据的缺失值 1的缺失值 代码应怎样编写来实现呢?

import pandas as pd
import numpy as np

data = pd.DataFrame({
    'a': [np.nan, 1, np.nan, 2, 3, np.nan, 4],
    'b': [0, 0, 1, 1, 1, 1, 0]
})

data_0 = data[data['b'] == 0]
data_1 = data[data['b'] == 1]

# 均值填充
data_0.fillna(data_0.mean(), inplace = True)
data_1.fillna(data_1.mean(), inplace = True)

data_new = pd.concat([data_0, data_1]).sort_index()

img