请问大家一下:利用word2vec进行词向量进行训练时,所用语料进行分词后,还需要去除标点符号吗?我利用搜狗新闻语料(分词后2.09G)进行词向量训练时,出现Exception in thread "main" java.lang.OutOfMemoryError: Java heap,我设置了jvm heap的大小,还是出现这个错误,该怎么解决呢?谢谢解答!**
内存设置还是太小,我使用这个参数 -Xmx6048M 可运行成功。