量化交易 米筐 因子数据处理--去极值
2. 去极值处理
不是删除,而是拉回正常范围。
2.1 三种方法
- 分位数去极值
- 中位数 绝对偏差去极值
- 正态分布去极值
3.分位数去极值
3.1 中位数
排序后,处于中间位置的那个数。Median
奇数:中间的那个数
偶数:中间两个数的平均值
3.2 四分位数
- 第一四分位数(Q1)排列后25%
- 第二四分位数(Q2)排列后 50% 中位数
- 第三四分位数(Q3)排列后75%
3.3 百分位数
百分位数:数据所处位置为整体的某个%位数
- 0 quantile = 0 percentile
- 0.25quantile = 25 percentile
- 0.50quantile = 50 percentile
- 0.75quantile = 75 percentile
3.4 分位数去极值
将分位数以外的极值, 用分位数点的值替换
Pandas DataFrame操作
from
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
