OLS回归实际Python操作中如何加入控制变量

如何在Python中ols回归加入控制变量,即现有ols回归我基本用于单个解释变量与被解释变量之间的关系,也有多个自变量对因变量的影响,但不知道如何变成构建核心解释变量加上几个控制变量和误差项对一个被解释变量影响的模型。

在 Python 中,可以使用 statsmodels 库的 OLS 函数来构建一个基于 OLS 回归的模型。下面是一个示例代码,展示了如何在 Python 中加入控制变量的方法。


假设你的数据是一个 Pandas 数据框 df,你希望构建一个预测 y 的模型,你的核心解释变量是 x1,控制变量是 x2 和 x3,你可以这样写代码:

import statsmodels.api as sm

# 将数据转换为模型所需的格式
X = sm.add_constant(df[['x1', 'x2', 'x3']])
y = df['y']

# 构建 OLS 模型
model = sm.OLS(y, X)
result = model.fit()

# 输出模型结果
print(result.summary())