pandas.get_dummies

get_dummies 是利用pandas实现one hot encode的方式。

>>> s = pd.Series(list('abca'))>>> pd.get_dummies(s)a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0>>> s1 = ['a', 'b', np.nan]>>> pd.get_dummies(s1)a  b
0  1  0
1  0  1
2  0  0>>> pd.get_dummies(s1, dummy_na=True)a  b  NaN
0  1  0    0
1  0  1    0
2  0  0    1>>> df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
...                    'C': [1, 2, 3]})>>> pd.get_dummies(df, prefix=['col1', 'col2'])C  col1_a  col1_b  col2_a  col2_b  col2_c
0  1       1       0       0       1       0
1  2       0       1       1       0       0
2  3       1       0       0       0       1>>> pd.get_dummies(pd.Series(list('abcaa')))a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0
4  1  0  0>>> pd.get_dummies(pd.Series(list('abcaa')), drop_first=True)b  c
0  0  0
1  1  0
2  0  1
3  0  0
4  0  0>>> pd.get_dummies(pd.Series(list('abc')), dtype=float)a    b    c
0  1.0  0.0  0.0
1  0.0  1.0  0.0
2  0.0  0.0  1.0


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部