1·为什么一样的代码负面词语明明文本里有但就是匹配不出来,正面词却可以,应该怎么处理
2·应该如何导出结果,现在的结果导出Excel和csv里看起来十分混乱,python里清晰的表格到csv里也有很多地方没有结果了
import jieba
import pandas as pd
df = pd.read_csv('S2/汇总内容.csv').astype(str)
df.head()
#读取词典,生成正负情感词表
negs = open('data/dict/negative.txt', encoding='utf-8').read().lower().split('\n')
poss = open('data/dict/positive.txt', encoding='utf-8').read().lower().split('\n')
def pos(text):
num = 0
words = jieba.lcut(text)
for word in words:
word=word.lower()
if word in poss:
num+=1
return num
def neg(text):
num = 0
words = jieba.lcut(text)
for word in words:
word=word.lower()
if word in negs:
num+=1
return num
def words_count(text):
return len(jieba.lcut(text))
df['pos_words_num'] = df['text'].apply(pos)
df['neg_words_num'] = df['text'].apply(neg)
df['words_num'] = df['text'].apply(words_count)
df.head()
df.to_csv('data/情感分析详细.csv', encoding='utf-8')
检查negs有内容没有先
negs = open('data/dict/negative.txt', encoding='utf-8').read().lower().split('\n')
print(negs)
代码测试是没问题的
问题1:你要先看一下jieba分词分出来没
问题2:可能把句子中的逗号当分隔符了,尝试直接保存xlsx格式