用命令(Command line)列出一个文本中使用最多的20个单词,这20个单词必须多于或等于6个字母。求命令代码,谢谢各位!
大概这样:
#完整命令
grep -Eo '\b\w{6,}\b' srcFile | sort | uniq -c | sort -nr | head -20
#各命令含义
#匹配源文件中的单词,并输出,正则表达式估计可以优化一下,更精准
grep -Eo '\b\w{6,}\b' srcFile
#对单词进行排序
sort
#单词计数、去重
uniq -c
#按计数排序,逆序
sort -nr
#取前20条记录
head -20