数据元组已经按分类器返回概率值的递减序排序。对于每个元组,计算真正例 (TP)、假正例(FP)、真负例(TN)和假负例(FN)的个数。计算真正例 率(TPR)和假正例率(FPR)。
图片贴不出来,大概就是有十个元组,元组的类是N或者P,还有概率。
比如元组1的类是P,概率是0.95,元组2的类是N,概率是0.85等等递减排列。
我想问的是题目所说的“分类器返回概率值”指的是什么?是贝叶斯方法中的后验概率吗?
如果是的话TP、FP等是怎么根据后验概率算出来的?
如果不是的话那个概率是什么?TP、FP等是怎么算出来的?
由图可知正元组有5个,负元组有5个,所以P=5,N=5。
(1)由元组1开始,该元组具有最高的概率得分,取该得分为阈值,即t=0.95,这样,分类器认为大于等于t的为正元组,故元组1为正,而其他元组为负。由于元组1的实际类标号为正,所以有一个真实例。因此TP=1,FP=0,TN=5,FN=4。可以计算TPR=TP/P=1/5=0.2,FPR=0。
(2)然后设置元组2的概率值0.85为阈值,因而此时元组1与元组2为正,而元组3~元组10被视作负。元组2的实际类标号为负,所以它是一个假正例。因此,TP=1,FP=1,TN=4,FN=4.可以计算TPR=TP/P=1/5=0.2,FPR=1/5=0.2。
(3)以此类推,可计算出每个元组的TP、FP、TN、FN、TPR、FPR。