【以下回答由 GPT 生成】
首先,我们需要导入所需要的库和模块。在这个问题中,我们需要使用scikit-learn库来训练回归决策树模型。
接下来,我们需要加载波士顿房价数据集。你可以使用scikit-learn提供的load_boston
函数来加载数据集。该函数会返回一个包含特征和目标变量的对象。
from sklearn.datasets import load_boston
boston = load_boston()
X = boston.data # 特征
y = boston.target # 目标变量
我们需要将数据集分为训练集和测试集。训练集用来训练模型,测试集用来评估模型的性能。你可以使用scikit-learn提供的train_test_split
函数来进行数据集的划分。
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
接下来,我们需要创建一个回归决策树模型,并使用训练集对其进行训练。你可以使用scikit-learn提供的DecisionTreeRegressor
类来创建回归决策树模型。
from sklearn.tree import DecisionTreeRegressor
model = DecisionTreeRegressor()
model.fit(X_train, y_train)
训练完成后,我们可以使用测试集进行模型的评估。常用的评估指标包括均方误差(Mean Squared Error,MSE)和决定系数(Coefficient of Determination,R2 Score)。
from sklearn.metrics import mean_squared_error, r2_score
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print("均方误差(MSE):", mse)
print("决定系数(R2 Score):", r2)
以上就是使用波士顿房价数据集训练回归决策树模型并进行评估的步骤。你可以根据自己的需要对模型进行调优和改进,例如使用交叉验证、调整模型的超参数等。希望对你有帮助!如果有任何问题,请随时提问。
【相关推荐】