文本由hash值表示,如何相似性计算

文本被hash值表示,如何计算文本间的相似性。如下图图片说明

Tab键分割了 文档标示 和文本的hash值。hash值由|分隔。如何计算两个文档之间的相似性

不知道是什么hash算法,一般如果hash是不可逆的,那么通过hash分析相似性就更难了。

既然是hash算法,就不是加密,而是摘要。摘要是不可逆的。