关于数据集的抽样问题

问题遇到的现象和发生背景

导入excel北京空气质量数据，然后用numpy抽样

问题相关代码，请勿粘贴截图

import numpy as np
import pandas as pd
data=pd.read_excel(r'C:\Users\18464\Desktop\北京市空气质量数据.xlsx')
np.random.seed(123)
sampler=np.random.randint(0,len(data),10)
print(sampler)
sample=np.random.permutation(len(data))[:10]
print(sample)
data.take(sampler)
data.loc[data['质量等级'=='优',:]]

运行结果及报错内容

TypeError: '(False, slice(None, None, None))' is an invalid key

我的解答思路和尝试过的方法

不是很懂为什么会出错

我想要达到的结果

得到随机抽样的结果

最后一句data.loc[data['质量等级'=='优',:]]写错了，'质量等级'=='优'不能作为索引。要使用布尔索引，这样改写一下：

print(data.loc[data['质量等级']=='优',:])

如对你有帮助，请点击下采纳。

传入可能是一个dataframe，应该先把它转化为ndarray，用data.values

您好，我是有问必答小助手，您的问题已经有小伙伴帮您解答，感谢您对有问必答的支持与关注！
PS：问答VIP年卡【限时加赠：IT技术图书免费领】，了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632