求帮忙改一下(实在改不了求告知怎么做,实在做不出来)
1.数据data.txt中给出了不同时间的各个网站的点击量。要求同学们统计整个这段时间内所有网站的点击量,并输出点击量排名前20名的网站和对应的点击次数(按照点击量从大到小输出)。
网站 点击量
品牌词产品 17600
品牌词广告 15865
百度 10858
品牌词运营 9768
百度 9228
品牌词导航 3824
品牌词运营 3673
品牌词运营 3553
四次元应用 3585
品牌词广告 3469
360 2908
品牌词产品 1858
搜狗 1996
四次元应用 1660
微信 1572
亿起发 2124
品牌词导航 1477
搜狗综会品专slm 1310
#############
import numpy as np
fr=open('data.txt','r+')
lines=fr.readlines()
retData={}
for line in lines:
items=line.strip().split("\t")
if items[0] in retData:
retData[items[0]]=retData.get(items[0])+items[1]
else:
retData[items[0]]=items[1]
for i in range(20):
web=items
count=retData[i]
print("[0:<10][1:>5]".format(web,count))
KeyError: 0
字典不是直接用下标访问的
代码修改后如下(你自己把文件读入部分和split部分改回去即可)
import numpy as np
fr = open('out.txt', 'r+', encoding='utf-8')
lines = fr.readlines()
retData = {}
for line in lines:
items = line.strip().split(" ")
print(items)
if items[0] in retData:
retData[items[0]] = retData.get(items[0])+items[1]
else:
retData[items[0]] = items[1]
sortedData=sorted(retData.items(),key=lambda x:x[1],reverse=True)
for i in range(20):
web = sortedData[i][0]
count = sortedData[i][1]
print("{0:<10}{1:>5}".format(web, count))
如果你提供的数据不足20个,还是会报越界错误,但你的文件里面应该不止20条数据,所以应该没问题