自然语言处理中中文字匹配

从一句话中拆分成单个字,然后在从几个等级不同的字频表中匹配它是属于哪个等级的字频表(在未知的情况下默认是从最低等级的字频表开始匹配).
求其实现过程原理!用Java实现。

首先你说的这个拆分,就是中文分词,你可以找一个分词库实现。然后你可以找词频表,google下有很多,如果你只是做学术的话。