key 值和 value 都是长整形,key 值可以重复 ,即一个 key值可以有多个 value 值,
各位大牛有没有什么好的想法觉得可以加快插入速度,比如多线程?
要提高效率,首先需要做两件事情,一个是算法优化,分析你的算法复杂度,是不是有更优化的算法存在。
比如hash表插入,最理想的算法也必须是logN,当然如果你超过这个,有优化的可能,如果已经是logN就不要折腾了。
然后是代码优化,你首先要分析你的算法的理论最优运行时间,比如说,你插入hash,必须要遍历一次数据,那么如果你想比这个时间还短,就不要费工夫了。
然后找到程序的热点,也就是调用次数最多,耗时最长的地方。对热点优化比盲目乱优化有效地多。另外避免重复优化,优化的代码要放在全局的角度来考虑。
至于多线程能不能提高性能,要看你的瓶颈是不是在cpu上,如果在io上,多线程只会帮倒忙,另外你的计算机要有不止1个处理器。
搜索引擎使用的是倒排索引,并且有分布式的架构。另外,搜索引擎编录数据不用考虑数据的完整性和事务的一致性。