新建一个txt文档,在里面输入一些关键词,关键词之间用一些特殊符号分开,使用字符串的一些函数实现将该文档的内容进行关键词分类并统计每个关键词的个数,将分类的关键词的个数写入另一个txt文档。(不用jieba)
大概步骤如此
1、用文件 open方法, 读入关键词文档内容, 用 split 方法切分到关键词列表
2、用文件 open方法,读入待分析文档
3、遍历 关键词列表 ,用字符串count() 方法,统计关键词次数 , 记录关键词统计列表
4、用文件open方法, 将 关键词统计列表 写入 txt 文档
1:
f = file("number.txt")
while True:
line = f.readline()
if len(line) == 0:
break
print line
f.close()
2:
# coding=gb2312
import sys
import string
if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}:
print("usage: uniqueword filename_1 filename_2 ... filename_n")
sys.exit()
#是否有输入参数,如果输入参数为空或者为-h, -help,则输出帮助信息
else:
words = {}
strip = string.whitespace + string.punctuation + string.digits + "\"'"
#设置strip去掉文本中单词的空格,符号和数字
for filename in sys.argv[1:]:
for line in open(filename):
for word in line.split():
word = word.strip(strip)
if len(word) >= 1:
words[word] = words.get(word, 0) + 1
#逐一打开参数中指定的文件,并读取每一行,再用字符串的split方法把读取的行抽取出
#每个单词,然后用strip过滤符号等,单词长度大于2的时候,把此单词加入到字典words中
#其中words.get(word, 0)的意思是取出key等于word的value,如果key为空,则把value置为默认值0
for word in sorted(words):
print("'{0}' occurs {1} times".format(word,words[word]))
#排序打印