用的pandas标准库,遍历xlsx文件时,“NA”字符串似乎识别不出来?小写的“na”都可以,这是什么原因,怎么解决呀
下面是代码和部分excel表
pandas 会将NA解释为NaN,你可以添加参数避免这种情况
pd.read_excel("1.xlsx", keep_default_na=False)
data = pd.read_excel('./demo.xlsx', keep_default_na= False)
keep_default_na:决定是否保留na_values默认的缺失值表示方式,
由于 NA 的实际值是未知的,因此将NA转换为布尔值会引发错误。这样在 if 条件中无法直接做逻辑判断,可以使用 pd.isna(pd.NA) 来判断。
data = pd.read_excel('./demo.xlsx', keep_default_na= False)
代码参考自下面实例:
设置keep_default_na参数解决问题。
这是NA使用 Pandas 读取 CSV 文件时保持字符串值的示例。
data.csv:
country_name,country_code
Mexico,MX
Namibia,NA
read_data.py:
import pandas as pd
data = pd.read_csv("data.csv", keep_default_na=False)
print(data.describe())
print(data)
输出:
country_name country_code
count 2 2
unique 2 2
top Namibia MX
freq 1 1
country_name country_code
0 Mexico MX
1 Namibia NA
你的NA和na是咋生成的啊。。。。