量化交易 米筐 因子数据处理 -- 市值中性化
因子数据处理 – 市值中性化
1. 中性化意义
防止选到的股票集中在固定的某些股票当中
-
市值影响,默认大部分因子都包含了市值的影响,去除其它因子存在的市值影响。
-
去除市值影响 市值 <==> 某因子 去除相关性
-
回归法去除
建立回归方程: x(特征:市值) * w + b = y(某因子)
回归方程预测: 市值(X) * 系数(w) + 偏置(b) = 预测值( y_predict)
计算偏差: 某因子(y) - 预测值(y_predict) = 偏差
偏差:不受影响的部分
2. 回归法API
from sklearn.linear_model import LinearRegression
- 把市值设置成特征,市值不进行任何处理
- 将其它因子设置成目标值
3. 案例:去除市净率与市值之间的联系部分
3.1 分析
- 获取两个因子数据
- 对目标值因子-市净率进行去极值,标准化处理
- 建立市值与市净率回归方程
- 通过回归系数,预测新的因子结果y_predict
- 求出市净率与y_predict的偏差 即心点因子值
3.2 代码
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
