下载好Cora数据集后该如何加载?
Cora数据集是一个常用的图像分类数据集,可以在PyTorch中使用torch_geometric.datasets模块中的Planetoid类进行加载。具体步骤如下:
# 1、导入需要的模块:
from torch_geometric.datasets import Planetoid
import torch
# 2、下载Cora数据集并指定数据存放的位置:
dataset = Planetoid(root='./data', name='Cora')
其中,root参数指定数据存放的位置,name参数指定使用哪个数据集,可选的数据集名称有Cora, Citeseer, Pubmed。
# 3、加载数据集:
data = dataset[0]
这里我们只加载了一个图像数据,因此dataset[0]即为我们需要的数据。
# 4、将数据转换为PyTorch的tensor:
x = data.x # 节点特征
y = data.y # 节点标签
edge_index = data.edge_index # 边的索引
这里的data.x是节点的特征矩阵,data.y是节点的标签,data.edge_index是边的索引矩阵。
现在你可以将x,y和edge_index传递给PyTorch中的图像分类模型进行训练和预测了。