·数据:20newsgroupshttp: / / doc.codingdict.com/sklearn/76/、文本新闻、情感分析数据集。·分词清理后计算每个文档的词频矩阵、和tfidf矩阵,为基于此实现文档分类、聚类提供数据表示。