如何进行海量文本词频统计

有百万级别篇文章需要进行分词然后统计词频,除了Python有没有,现有的简单工具可以快速搞定。

excel好像可以,此外就是一些第三方做好的软件之类的,不过这个数据量,我也不知道第三方让不让你白嫖的问题,建议去找找开源项目看下。
不过除了python外,其他的你得实现分词,如果你是分好词语的话,其他语言都可以,类似java,cpp,没分词的话最好还是python,不然你的自己实现分词,重复造轮子还不一定有python好用。