关于数据集的抽样问题

问题遇到的现象和发生背景

导入excel北京空气质量数据,然后用numpy抽样

问题相关代码,请勿粘贴截图

import numpy as np
import pandas as pd
data=pd.read_excel(r'C:\Users\18464\Desktop\北京市空气质量数据.xlsx')
np.random.seed(123)
sampler=np.random.randint(0,len(data),10)
print(sampler)
sample=np.random.permutation(len(data))[:10]
print(sample)
data.take(sampler)
data.loc[data['质量等级'=='优',:]]

运行结果及报错内容

TypeError: '(False, slice(None, None, None))' is an invalid key

我的解答思路和尝试过的方法

不是很懂为什么会出错

我想要达到的结果

得到随机抽样的结果

最后一句data.loc[data['质量等级'=='优',:]]写错了,'质量等级'=='优'不能作为索引。要使用布尔索引,这样改写一下:

print(data.loc[data['质量等级']=='优',:])

如对你有帮助,请点击下采纳。

传入可能是一个dataframe,应该先把它转化为ndarray,用data.values

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632