量化交易 米筐 因子数据处理--去极值

2. 去极值处理

不是删除,而是拉回正常范围。

2.1 三种方法
  • 分位数去极值
  • 中位数 绝对偏差去极值
  • 正态分布去极值

3.分位数去极值

3.1 中位数

排序后,处于中间位置的那个数。Median

奇数:中间的那个数

偶数:中间两个数的平均值

3.2 四分位数
  • 第一四分位数(Q1)排列后25%
  • 第二四分位数(Q2)排列后 50% 中位数
  • 第三四分位数(Q3)排列后75%
3.3 百分位数

百分位数:数据所处位置为整体的某个%位数

  • 0 quantile = 0 percentile
  • 0.25quantile = 25 percentile
  • 0.50quantile = 50 percentile
  • 0.75quantile = 75 percentile
3.4 分位数去极值

将分位数以外的极值, 用分位数点的值替换

Pandas DataFrame操作

from


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部