sklearn笔记:StratifiedKFold和StratifiedShuffleSplit的区别?

直接上图:
在这里插入图片描述
在这里插入图片描述
由上图可见,KFold和ShuffleSplit的最大不同就是,KFold进行的n_split划分,每次的划分数据都不会重复,而ShuffleSplit的会有重复的;

进一步展开的说:

  • KFold 和ShuffleSplit都是分层抽样,都可以进行n次split(上例中都是4次)以便用于交叉验证,都可以在split之前把数据“洗洗牌”打乱;
  • 不同点是KFold,在shuffle=True的设定下,别管split几次,都是shuffle一次;之后的split得到的测试数据都不重复,最后数据集的每个部分都做过一次测试数据集;ShuffleSplit是split的次数和shuffle的次数一样多,每次split的时候就是test_size或者train_size的比例进行随机抽样,最后数据集里的样本会多次出现在测试集中;


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部