jieba分词为什么会在文本数量变多的情况下,分词的数量反而变小了呢?

问题遇到的现象和发生背景

最近利用jieba分词划分csv格式的新闻内容,来分析新闻的主要关键字。发现有些地方的新闻文本数量又1800多条,但分出来的词的数量也就600多个。同类的1000条新闻却能划分出来1万个词。请问这是什么原因呢?

我的解答思路和尝试过的方法

尝试解决的办法:
删除新闻中的""转义字符和特殊字符,没有效果。

你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。