Python jupyter notebook 怎么把自己的数据导入到数据集里面去

Python,jupyter notebook,scikit-learn包,怎么把excel导入到datasets里面去,如何把自己的数据导入数据集,麻烦求解,小菜懂不了一点儿,求帮

在jupyter notebook中,可以这样导入自己的Excel数据到 scikit-learn 的数据集:

  1. 安装 xlrd 库来读取 Excel 文件:
    pip install xlrd
  2. 导入所需库:
    python
    import pandas as pd
    from sklearn.datasets import Dataset
  3. 读取 Excel 文件,获得 DataFrame:
    python
    df = pd.read_excel('yourfile.xls')
  4. 将 DataFrame 转换为 Dataset:
    python
    dataset = Dataset(df)
  5. 你现在可以在 scikit-learn 中使用 dataset 这个数据集了,例如:
    python
    from sklearn.linear_model import LogisticRegression

X = dataset.data
y = dataset.target

logreg = LogisticRegression()
logreg.fit(X, y)
这样你就成功地将 Excel 数据导入到 scikit-learn 数据集中了。

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

使用 python 和 pandas 从 Jupyter Notebook 和 Visual Studio 代码中的本地计算机加载
第 1 步:将数据集复制到包含笔记本的同一文件夹中。
第2步:导入pandas
步骤 3:使用这行代码加载位于您当前工作的同一文件夹中的数据。
步骤 4:使用 data.head() 验证数据是否正确加载。

方法 2:从 Jupyter Notebook 和 Visual Studio Code 中的 URL 加载数据集
从 URL 加载数据非常简单。
**
第 1 步:获取包含数据的 URL

第 2 步:将 Pandas 导入为 pd。

有两种方法可以执行从 URL 读取数据的操作。
选项 1:
URL =“网址链接”
数据 = pandas.read_csv(URL)然后
Data.head()验证其是否正确加载

选项2:
Data = pandas.read_csv("url 链接")然后
Data.head()验证其是否正确加载

这两种方法都可以正常工作,并且它们之间没有区别。如何选择加载 CSV 文件取决于个人喜好