对 关系 民生 的 大事 群众 一向
超出 标准 的 房屋 面积 要 交税 大家 就
针对上述文本,过滤掉停用词“对,的,要,就”,采取如下命令,运行后,停用词没有被过滤掉
import os
os.chdir(r'C:\Users\admin\Desktop\LDA-master')
import pandas as pd
import numpy as np
da=pd.read_csv('1.txt',encoding='utf-8',header=None)
stop=pd.read_csv('stoplist.txt',encoding='utf-8',header=None,sep='tipdm')
da[1]=da[0].apply(lambda s:str(s).split(' '))
da[2]=da[1].apply(lambda y: [i for i in y if i not in stop])
请教问题出在哪里了?
txt文件不是用read_table来读取的吗?