我的核心问题:
想要将“txt文献摘录”整合成一个excel文档。如下图:
txt文本
希望得到的结果(这是我以前用Excel做的,小样本可以,但量大时候就不太方便):
下面是我自己看大家的代码学着写了一下,但是错的,txt确实不能读到excel中:
import xlwt
import os,re
def writeinexcel():
f = open('/Users/maqian/Downloads/pericles_exported_citations.txt','r',encoding='utf-8') #打开数据文本文档,注意编码格式的影响
wb = xlwt.Workbook(encoding = 'utf-8') #新建一个excel文件
ws1 = wb.add_sheet('first') #添加一个新表,名字为first
ws1.write(0,0,'作者')
ws1.write(0,1,'题目')
ws1.write(0,2,'关键词 ')
ws1.write(0,3,'摘要')
row = 1
for lines in f:
a=f.readlines()
if len(a)!=0:
if "AU - " in a:
ws1.write(row, 0 ,a)
elif "TI - " in a:
ws1.write(row, 1 ,a)
elif "KW - " in a:
ws1.write(row, 2 ,a)
elif "AB - " in a:
wsl.write(row, 3 ,a)
else:
continue
else:
row+=1
wb.save("/Users/maqian/Downloads/数据表.xls")
writeinexcel()
单纯用excel我可以解决,但因为之后学术还需要做这些,所以想学会这种方法。同时,我发现自己写代码没有很好的逻辑,请问大家如何建立一种顺序感?
可以试试写成一个csv文件,代码生成csv文件后在就可以用excel打开了