分类器的比较方法

目标:

比较不同分类器的性能,以确定在给定的数据集上哪种分类器效果更好。

一、估计准确度的置信区间

通过将分类任务用二项式试验建模来推导置信区间。给定一个包含N个记录的检验集,令X是被模型正确预测的记录数,p是模型的真正准确率。通过吧预测任务用二项式试验建模,X服从均值为Np、方差为Np(1-p)的二项分布。可以证明经验准确率acc=X/N也是均值为p,方差为p(1-p)/N的二项分布。当N充分大时,通常用正态分布近似。根据正态分布,可以推导出acc的置信区间:

P(Zα/2accpp(1p)/NZ1α/2)=1α P ( − Z α / 2 ≤ a c c − p p ( 1 − p ) / N ≤ Z 1 − α / 2 ) = 1 − α

其中 Zα/2 Z α / 2 Z1α/2 Z 1 − α / 2 分别是在置信水平 (1α) ( 1 − α ) 下由标准正态分布得到的上界和下界。
重新整理不等式,得到p的置信区间如下:

2×N×acc+Z2α/2±Zα/2Z2α/2+4Nacc4Nacc22(N+Z2α/2) 2 × N × a c c + Z α / 2 2 ± Z α / 2 Z α / 2 2 + 4 N a c c − 4 N a c c 2 2 ( N + Z α / 2 2 )

二、比较两个模型的性能

考虑一对模型 M1 M 1 M2 M 2 ,他们在两个对立的检验集 D1 D 1 D2 D 2 上进行评估,令 n1 n 1 D1 D 1 中的记录数, n2 n 2 D2 D 2 中的记录数。另外,假设 M1 M 1 D1 D 1 上的错误率为 e1 e 1 M2 M 2 D2 D 2 上的错误率为 e2 e 2 。目标是检验 e1 e 1 e2 e 2 的观察差是否统计显著 (错误率的观察差 d=e1e20 d = e 1 − e 2 ≠ 0 )。
d的方差为:

σ^d=e1(1e1)n1+e2(1e2)n2 σ ^ d = e 1 ( 1 − e 1 ) n 1 + e 2 ( 1 − e 2 ) n 2

在置信水平(1- α α )%下,实际差 dt d t 的置信区间为:

dt=d±zα/2σ^d d t = d ± z α / 2 σ ^ d

三、比较两种分类方法的性能

将数据集D划分为k个大小相等的部分,然后使用每种分类方法,在k-1份数据上构建模型,并在剩余的划分上进行检验,该步骤重复k次,每次使用不同的划分进行检验。
观察差的总方差为:

σ^2dcv=kj=1(djd¯¯¯)2k(k1) σ ^ d c v 2 = ∑ j = 1 k ( d j − d ¯ ) 2 k ( k − 1 )
用t分布计算得到置信区间为:
dcvt=d^±t(1α),k1σ^dcv d t c v = d ^ ± t ( 1 − α ) , k − 1 σ ^ d c v

【几个概念】

1.二项式试验

(1)试验由N个独立的试验组成,其中每个试验有两种可能的结果:成功或失败。
(2)每个试验成功的概率p是常数。

如果X是N次试验观察到的成功次数,则X取一个特定值v的概率由均值为Np、方差为Np(1-p)的二项分布给出。

【参考文献】

Pang-Ning Tan等,数据挖掘导论,中国工信出版集团


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部