从百万级数据量中查重

最近打算在起点写个小说,然而起了很多次书名都被告知重复,我不禁想到一个问题:起点的书不管有没有签约数量起码在上百万本,但是在判断重复的时候只用到不到1秒的时间,这么短的时间起点是怎么这么快就反馈给我书名重复的?还是腾讯的一些游戏,比如DNF还有CF,也有名称查重判断,用时也都特别短,而且腾讯游戏的玩家数量级更加恐怖,那腾讯又是怎么在这么短的时间里提示我名称重复的呢?

索引了解一下