如题:请问如果一个文件夹中有多个文本文档,那么如何使用停用词表或者其他方法,批量对这些文档进行数据预处理呢?比如去停用词,用jieba分词。
使用Python中的os和glob库来实现对文件夹下的多个文本进行去停用词和分词。
Hint: 结点作为字典的Key,结点的邻居作为字典的Value,从而构成一个图。