如何构建一棵决策树

常见数据类型

连续型特征 /二分类特征/分级特征(rank data)/多分类特征

常见术语

  • 根节点(只有箭头指出)
    在这里插入图片描述
  • 内节点(有箭头指出和指入)

在这里插入图片描述

  • 叶子节点(只有箭头指入)

在这里插入图片描述

如何确定一棵决策树?

通过Gini系数,越小的越好
以以下的数据为例进行讲解
在这里插入图片描述

对每个特征做以下统计
在这里插入图片描述

最终得到
在这里插入图片描述

那么Gini系数则可以这样计算


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部