grep 匹配中文的问题

bug
如图
tail -n 10 20150420102314.006.txt中是有非中文的行的
然而用
grep -c [^\u4e00-\u9fa5] 20150420102314.006_utf8.txt

grep -c [^\x00-\xff] 20150420102314.006.txt
的结果都是151
然而20150420102314.006.txt的行数是151行,意思是全部匹配了
但是用Notepad++或者gedit用上述正则都是OK的

http://www.cnblogs.com/Fang3s/p/4414914.html

jarvan@jarvan-ubuntu:/media/jarvan/Software/Documents/code/kaldi.git/trunk/egs/atc_cn/s5$ grep -nP "\xE4\xB8\xAD\xE6\x96\x87|\xD6\xD0\xCE\xC4" ./demo_exe_gbk.c
jarvan@jarvan-ubuntu:/media/jarvan/Software/Documents/code/kaldi.git/trunk/egs/atc_cn/s5$ grep -nP "\xD6\xD0\xCE\xC4" ./demo_exe_gbk.c

什么都没输出,我用UltraEdit看了,"中文"二字在我的./demo_exe_gbk.c中确实是D6D0 CEC4,然而grep不匹配
求解

去掉所有符号,剩下的就是中文啦,可以参考哈。cat 1.txt | sed 's/[a-zA-Z0-9[:punct:]]//g' | grep -v '^$'

http://blog.csdn.net/u010627840/article/details/41863395