有偿求这段代码和运行结果

因为上课请假了一段时间,跟不上进度了…最后一题写不出来,想求大家解答

img

import dask.dataframe as dd
from dask.distributed import Client
from dask_ml.model_selection import train_test_split
from dask_ml.metrics import mean_squared_error, accuracy_score
from dask_ml.ensemble import RandomForestRegressor

# 创建一个Dask分布式Client,设置工作数为你学号的最后一位数字。假设学号最后一位数字是8。
client = Client(n_workers=8)

# 加载数据,假设所有的数据文件都在目录 'wangsitvi2031027128' 中。
df = dd.read_csv('wangsitvi2031027128/*.csv')

# 假设要预测的目标变量的列名是 'target'。你要将这个名字替换为你的数据中实际的目标变量名。
X = df.drop('target', axis=1)
y = df['target']

# 用Dask-ML的train_test_split函数将数据集分为训练集和测试集。这里假设测试集占整个数据集的20%。
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建一个RandomForestRegressor模型。要根据具体任务调整模型的参数。
model = RandomForestRegressor()

# 训练模型。
model.fit(X_train.compute(), y_train.compute())

# 预测测试集的结果。
y_pred = model.predict(X_test.compute())

# 用Dask-ML的metrics模块来评估模型的性能。这里用的是均方误差(Mean Squared Error)作为评价指标。要根据你的具体任务选择合适的评价指标。
mse = mean_squared_error(y_test.compute(), y_pred)

print(f'模型的均方误差为: {mse}')


import dask.dataframe as dd
from dask_ml.model_selection import train_test_split
from dask.distributed import Client
from dask_ml.ensemble import RandomForestClassifier, RandomForestRegressor
from dask_ml import metrics

# 加载数据
data_path = 'wangsirui2031027128'  # 数据目录路径
df = dd.read_csv(data_path + '/*.csv')  # 使用Dask DataFrame加载数据

# 数据集划分
X = df.drop('target_column', axis=1)  # 特征列
y = df['target_column']  # 目标列
X_train, X_test, y_train, y_test = train_test_split(X, y)

# 创建并连接Dask分布式集群
client = Client(n_workers=8)  # 设置工作数为学号最后一位数字

# 训练模型
model = RandomForestClassifier()  # 使用RandomForestClassifier
model.fit(X_train, y_train)  # 拟合模型

# 预测和评估
y_pred = model.predict(X_test)  # 模型预测
accuracy = metrics.accuracy_score(y_test, y_pred)  # 分类模型评价指标
print("模型的准确率:", accuracy)