怎样利用某种数据结构,然后建立起某种索引,加快文本检索速度,如果有类似于word的查找算法实现最好不过了,求大神指教,谢了
文本索引和搜索http://wenku.baidu.com/link?url=8lJCf08d6IdLRUgXvl-4ruHT_RWU7xjIcZpvsIDUa7vwR5N63kn8q4PtDV7Kjy64jDU7ctvdaDD-0nUOUgFequw-3vx0Ik4zpGMQVL5hQaO
word的查找算法效率并不高,它就是顺序查找。要想做文本检索,可以使用倒排索引。对于中文来说,首先需要分词。倒排索引的原理就是将文本中的单词提取出来,建立单词->对应文章位置的映射关系,这样直接通过关键字就能找到文本了。具体实现google:倒排索引 全文检索