首页
编程
java
php
前端
首页
编程
java
php
前端
python jieba库BOW词袋语法
求帮忙,题目是LDA主题生成,使用的库为
import jieba
import re
from gensim.models import LdaModel
from gensim import corpora
百度了好久没找到输出方法,对于jieba库内容不熟悉
jieba没有BOW词袋语法,它只能分词分句,你要做BOW词袋只有gensim库,,具体可以参考下:
Python 自然语言处理(基于Gensim)_Xy-Huang的博客-CSDN博客
欢迎加入学习交流QQ群:657341423Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口。 简单地说,Gensim主要处理文本数据,对文本数据进行建模挖掘。...
https://xyhuang.blog.csdn.net/article/details/80326363
点击展开全文