闲着无聊的时候,小明想了一个游戏,先在纸上写上一段英文,然后统计其中每个不同的单词的出现次数。现在请你编程,根据给定的英文段落统计各个不同的英文单词的出现次数,并按出现次数从大到小输出单词和其出现次数,若出现次数一样则按单词的ASCII顺序从小到大输出。
简单起见,我们约定:(1)单词区分大小写,如"the"与"The"当作2个不同的单词;(2)除了大小写英文字母外的其它符号都当作单词间隔符,如"I'm"当作2个单词;(3)每段英文由若行文字组成。
另外,因为是随便写的英文,可能不遵守语法,例如,单词间可能不止一个空格,而行末却可能还有些空格。
输入格式:
输入数据的第一行为一个正整数T, 表示测试数据的组数。然后是T组测试数据,每组测试数据先输入一个正整数n(n<=10),然后是n行文字(每行长度不超过200字符,且只包含英文字母、空格符和标点符号,每个单词的长度不超过20字母)。
输出格式:
对于每组测试,按描述中要求的顺序逐行输出各个不同单词及其出现次数,之间空一个空格。
输入
2
2
Just for you.
I say, "Just for you."
2
I am a student.
You're a teacher.
输出
Just 2
for 2
you 2
I 1
say 1
a 2
I 1
You 1
am 1
re 1
student 1
teacher 1
import re
from collections import Counter
content = []
T = int(input(">>>"))
for _ in range(T):
n = int(input(">>>"))
n1 = []
for i1 in range(n):
n1.append(input(">>>"))
content.append(n1)
for i in content:
s = ' '.join(i)
result = re.split('[^a-zA-Z]+', s)
result = [i for i in result if i]
res = Counter(result)
for k, v in res.items():
print(f"{k} {v}")