有博客提到(链接在最后)库difflib的类SequenceMatcher的quick_ratio()方法,其功能为比较文本的距离,并把结果量化成[0,1]之间,相同的时候返回1,没有相同片段返回0。
quick_ratio()方法,计算公式如下:
计算所有匹配片段的长度之和T,匹配度等于2*T/(len(a)+len(b))
如:
a="helloworld"
b="hellopython"
则,T = 6
a与b之间的匹配度为:(2 x 6)/(10+11)=0.571
对此有几个疑问:
import difflib as dl
a="helloworld"
b="hellopython"
x=dl.SequenceMatcher(a,b).quick_ratio()
print(x)
博客链接:https://blog.csdn.net/JulyLi2019/article/details/122410718