量化交易 米筐 因子数据处理 -- 市值中性化

因子数据处理 – 市值中性化

1. 中性化意义

防止选到的股票集中在固定的某些股票当中

  • 市值影响,默认大部分因子都包含了市值的影响,去除其它因子存在的市值影响。

  • 去除市值影响 市值 <==> 某因子 去除相关性

  • 回归法去除

    建立回归方程: x(特征:市值) * w + b = y(某因子)

    回归方程预测: 市值(X) * 系数(w) + 偏置(b) = 预测值( y_predict)

    计算偏差: 某因子(y) - 预测值(y_predict) = 偏差

    偏差:不受影响的部分

2. 回归法API

from sklearn.linear_model import LinearRegression
  • 把市值设置成特征,市值不进行任何处理
  • 将其它因子设置成目标值

3. 案例:去除市净率与市值之间的联系部分

3.1 分析
  • 获取两个因子数据
  • 对目标值因子-市净率进行去极值,标准化处理
  • 建立市值与市净率回归方程
  • 通过回归系数,预测新的因子结果y_predict
  • 求出市净率与y_predict的偏差 即心点因子值
3.2 代码
                        


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部