我下载了斗破的小说当做语料,保存为json格式。但是当我用with open打开文件,查看内容时,发现控制台的内容和我保存的内容并不一样。我保存的时候是从第一章开始的,打印在控制台上的却是小说中间的一篇。等我第二次运行的时候,他出来的内容又不一样
第一次代码:
with open(r'F:\GTP\GPT-Chinese\GPT2-Chinese-old_gpt_2_chinese_before_2021_4_22\data\train.json', 'r',encoding='utf-8') as f:
print(f.read())
第二次代码:
with open(r'F:\GTP\GPT-Chinese\GPT2-Chinese-old_gpt_2_chinese_before_2021_4_22\data\train.json', 'r',encoding='utf-8') as f:
print(f.readlines())
read:
readlines:
望各位有识之士不吝赐教
你在将抓取的内容放入json文件的时候模式用a+, a+追加写, w+会清空文件重新写;
有用记得点个采纳
with open(r'F:\GTP\GPT-Chinese\GPT2-Chinese-old_gpt_2_chinese_before_2021_4_22\data\train.json', 'r',encoding='utf-8') as f:
for l in f.readlines():
print(l)
这样就一样了。readlines() 是返回列表, 要逐个print 才好看效果。
你的截图看不到右侧滚动条,所以无从判断。例如readlines()
出来的是列表,你的截图里面我没看到列表的方括号,所以根本不知道是不是从这里开始的,也就无从判断你的输出是否正确。