SVM在文本分类中的使用

现在在研究自然语言处理,要用SVM对文本进行分类。但是SVM的训练与测试文件都是数据格式的,而我要处理的是纯文本文件,有没有人知道如何将纯文本文件转化为要求的数据格式呢?

http://blog.csdn.net/lionzl/article/details/48159469