请问C#中从1000多万个文本文件中查询一个数据,用什么算法会比较高效?用数据库么
...关键这1000多万个文本文件怎么生成的,没有索引,怎么查找都没效率,关键是文件读写占用了时间。
肯定是要先做预处理,如果是文本数据,那么就需要先分词,然后建立倒排索引(全文索引)
用lucence等建立全文索引来进行查找。