将判断题题干提取出来,写了如下代码。
import pdb
import pandas as pd
data=pd.read_csv('C:\panduan.txt',header=None,encoding='utf-8',sep ='\t')
dlen=len(data)
st=str(data[0])
st=st.replace("(","")
st=st.replace("(","")
st=st.replace(")",")")
ss=st.split(")")
wd=[]
for item in ss:
pdb.set_trace()
da=item.split(".")
print(da[1])
d1=str(da[1]).strip()
print(d1)
wd.append(d1)
pdb.set_trace()
writ=pd.DataFrame(wd)
writ.to_csv('C\panduan.csv')
获取的结果只有前面几个数据和最后一个,中间的没有了。
用pdb调试发现,中间的数据被用三个点代替了。
怎么解决呢?
import pandas as pd 下边加上
#显示所有行(参数设置为None代表显示所有行,也可以自行设置数字)
pd.set_option('display.max_columns',None)
#显示所有列
pd.set_option('display.max_rows',None)