[机器学习] 手撕XGBoost超参数

2023-10-06 23:07:23

XGBoost版本： 1.4.2

首先，对于不同的任务，XGBoost有不同的超参数以及默认值。可以使用get_params()函数将当前模型使用的超参数打印出来：

import xgboost as xgbparams = {'n_estimators': 4,'max_depth': 3}
model = xgb.XGBRegressor(**params)
model.fit(X, y)## 输出超参数
print(model.get_params())

{'objective': 'reg:squarederror','base_score': 0.5,'booster': 'gbtree','colsample_bylevel': 1,'colsample_bynode': 1,'colsample_bytree': 1,'gamma': 0,'gpu_id': -1,'importance_type': 'gain','interaction_constraints': '','learning_rate': 0.300000012,'max_delta_step': 0,'max_depth': 6,'min_child_weight': 1,'missing': nan,'monotone_constraints': '()','n_estimators': 100,'n_jobs': 12,'num_parallel_tree': 1,'random_state': 0,'reg_alpha': 0,'reg_lambda': 1,'scale_pos_weight': 1,'subsample': 1,'tree_method': 'exact','validate_parameters': 1,'verbosity': None}

n_estimators：使用多少棵树来拟合，也可以理解为多少次迭代。默认100；
learning_rate：学习率，每棵树的预测结果都要乘以这个学习率，默认0.3；

树相关参数：
max_depth：每一棵树最大深度，默认6；
min_child_weight：可以理解为叶子节点最小样本数，默认1；
gamma：叶节点上进行进一步分裂所需的最小"损失减少"。默认0；

抽样：
subsample：训练集抽样比例，每次拟合一棵树之前，都会进行该抽样步骤。默认1，取值范围(0, 1]

列抽样：
colsample_bytree：每次拟合一棵树之前，决定使用多少个特征。
colsample_bylevel：每层树节点，可以使用多少个特征。
colsample_bynode：每个节点分裂之前，决定使用多少个特征。
这三个参数默认都是1，取值范围(0, 1]，列抽样也可以理解为特征抽样，注意这三个参数是同时作用的，比如训练集总共有64个特征，参数{‘colsample_bytree’:0.5, ‘colsample_bylevel’:0.5, ‘colsample_bynode’:0.5}，则每次拟合一棵树之前，在64个特征中随机抽取其中32个特征，然后在树的每一层，在32个特征中随机抽取16个特征，然后每次节点分裂，从16个特征中随机抽取8个特征。

树方法：
tree_method：默认是auto，会自动选择最保守的方式。这个是决定训练速度的关键超参数。一般有三种树方法：exact（精确方法），approx（近似方法），hist（直方图方法），其中hist就是LightGBM中的直方图方法，速度最快，approx速度次之，exact最慢。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 常见的超参数调优方法
下一篇 > php配置redis哨兵模式,Redis 哨兵模式原理

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

[机器学习] 手撕XGBoost超参数

相关文章