用命令处理文件,找出文件中最常用的20个单词

用命令(Command line)列出一个文本中使用最多的20个单词,这20个单词必须多于或等于6个字母。求命令代码,谢谢各位!

大概这样:

#完整命令
grep -Eo '\b\w{6,}\b' srcFile | sort | uniq -c | sort -nr | head -20
#各命令含义
#匹配源文件中的单词,并输出,正则表达式估计可以优化一下,更精准
grep -Eo '\b\w{6,}\b' srcFile  
#对单词进行排序
sort          
#单词计数、去重    
uniq -c
#按计数排序,逆序
sort -nr 
#取前20条记录
head -20

可以参考第五点,按多个条件排序。
Linux下的sort排序命令详解(二) - 回家的流浪者 - 博客园 有时候学习脚本,你会发现sort命令后面跟了一堆类似-k1,2,或者-k1.2 -k3.4的东东,有些匪夷所思。今天,我们就来搞定它—-k选项! 1 准备素材 第一个域是公司名称,第二个域是公司人数, https://www.cnblogs.com/longjshz/p/5797933.html