分类器的比较方法
目标:
比较不同分类器的性能,以确定在给定的数据集上哪种分类器效果更好。
一、估计准确度的置信区间
通过将分类任务用二项式试验建模来推导置信区间。给定一个包含N个记录的检验集,令X是被模型正确预测的记录数,p是模型的真正准确率。通过吧预测任务用二项式试验建模,X服从均值为Np、方差为Np(1-p)的二项分布。可以证明经验准确率acc=X/N也是均值为p,方差为p(1-p)/N的二项分布。当N充分大时,通常用正态分布近似。根据正态分布,可以推导出acc的置信区间:
P(−Zα/2≤acc−pp–√(1−p)/N≤Z1−α/2)=1−α P ( − Z α / 2 ≤ a c c − p p ( 1 − p ) / N ≤ Z 1 − α / 2 ) = 1 − α
其中 Zα/2 Z α / 2 和 Z1−α/2 Z 1 − α / 2 分别是在置信水平 (1−α) ( 1 − α ) 下由标准正态分布得到的上界和下界。
重新整理不等式,得到p的置信区间如下:
二、比较两个模型的性能
考虑一对模型 M1 M 1 和 M2 M 2 ,他们在两个对立的检验集 D1 D 1 和 D2 D 2 上进行评估,令 n1 n 1 是 D1 D 1 中的记录数, n2 n 2 是 D2 D 2 中的记录数。另外,假设 M1 M 1 在 D1 D 1 上的错误率为 e1 e 1 , M2 M 2 在 D2 D 2 上的错误率为 e2 e 2 。目标是检验 e1 e 1 和 e2 e 2 的观察差是否统计显著 (错误率的观察差 d=e1−e2≠0 d = e 1 − e 2 ≠ 0 )。
d的方差为:
在置信水平(1- α α )%下,实际差 dt d t 的置信区间为:
三、比较两种分类方法的性能
将数据集D划分为k个大小相等的部分,然后使用每种分类方法,在k-1份数据上构建模型,并在剩余的划分上进行检验,该步骤重复k次,每次使用不同的划分进行检验。
观察差的总方差为:
用t分布计算得到置信区间为:
dcvt=d^±t(1−α),k−1σ^dcv d t c v = d ^ ± t ( 1 − α ) , k − 1 σ ^ d c v
【几个概念】
1.二项式试验
(1)试验由N个独立的试验组成,其中每个试验有两种可能的结果:成功或失败。
(2)每个试验成功的概率p是常数。
如果X是N次试验观察到的成功次数,则X取一个特定值v的概率由均值为Np、方差为Np(1-p)的二项分布给出。
【参考文献】
Pang-Ning Tan等,数据挖掘导论,中国工信出版集团
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
