for 循环抓取每页的信息形成dataframe有点问题,帮忙看看
可以先使用列表和append(),每页迭代一次,分别收集每一列在这一页的数据。最后以字典为参数,七个列表依次为键值对的值,创建一个DataFrame即可。
此外还有一种思路,如果您读取的是网页数据,可以直接使用read_html()方法,如果您读取的是pdf数据,则也可以直接使用相关接口,如
pdf = pdfplumber.open(filename)
first_page = pdf.pages[0]
table = first_page.extract_table()
望参考 或采纳。
看好你的文件里的分隔符号,然后根据这个方法直接读就行了,举例:
df = pd.read_csv(io.StringIO(a), lineterminator=';', header=None)
参考链接:
https://blog.csdn.net/my__blog/article/details/121608841