数据框使用布尔索引后,原本的行名1,2,3,4,5,6,结果中间第三行被过滤后,列名3也没有了,怎么从新给布尔索引后的数据框批量弄成航母行名1,2,3,4,5,6
根据题主的描述,应该是存在两个问题:
根据上述对题主描述问题的重新定义,我尝试去建立了一个数据框来模拟题主的问题:
import numpy as np
import pandas as pd
data = {}
a = []
for i in range(5):
for row in range(5):
a.append(round(np.random.rand(),2))
row += 1
data.update({i:a})
a = []
i += 1
df = pd.DataFrame(data)
df
#输出
0 1 2 3 4
0 0.57 0.74 0.49 0.38 0.93
1 0.18 0.97 0.23 0.19 0.29
2 0.49 0.51 0.23 0.95 0.42
3 0.05 0.85 0.26 0.13 0.96
4 0.68 0.99 0.75 0.29 0.27
首先是第一个问题:对数据框使用布尔切片。预期是过滤掉index = 3的数据,结果把columns = 3的数据也过滤了。
如果在数据框内尝试对索引或者字段进行布尔切片的话,一般使用的代码是df[df.index == 'target']或者df[df.columns == 'target']。
在本例子中,如果想达到题主的预期,使用的代码应该是这样的:
df[df.index != 3]
#输出
0 1 2 3 4
0 0.57 0.74 0.49 0.38 0.93
1 0.18 0.97 0.23 0.19 0.29
2 0.49 0.51 0.23 0.95 0.42
4 0.68 0.99 0.75 0.29 0.27
我不太清楚题主采用的是哪一种布尔切片方式,正常来说应该只会对索引或者字段单独进行了筛选,建议使用上述方式来进行切片。
然后是第二个问题:对已经索引后的数据框的index,重新批量修改为顺序数据。
思路是将索引后的结果进行保存后,使用reset_index()重置索引。
其中reset_index()里面有两个参数:drop = True,重置索引后不保留原来的索引编号;inplace = True,重置索引后直接将原本的浅拷贝保存在原数据框内。
df2 = df[df.index != 3]
df2.reset_index(drop = True,inplace = True)
df2
#输出
0 1 2 3 4
0 0.57 0.74 0.49 0.38 0.93
1 0.18 0.97 0.23 0.19 0.29
2 0.49 0.51 0.23 0.95 0.42
3 0.68 0.99 0.75 0.29 0.27
在这里有一个小技巧:赋值新的数据框副本时,建议在代码后方增加.copy(deep = True),目的是避免在对新数据框进行处理时影响到原本的数据框。
由于pandas在处理数据时很多时候返回的都是浅拷贝,加上上述代码的话能避免比较多的问题。
最终的代码是这样的:
df2 = df[df.index != 3].copy(deep = True)
df2.reset_index(drop = True,inplace = True)
df2
漂亮,谢谢,reset_index就是我要找的,谢谢大佬