pandas删除满足条件的行_入门Pandas练习

858e4e5130cd12717a6b6e17a5c43227.png

本节主要是自己学习pandas的练习,与你分享。

导入Pandas与NumPy

import numpy as np
import pandas as pd

生成Series时,pandas默认生成整数索引,我们尝试一下。

s = pd.Series([23,2,5,np.nan,6,9])
s

aeaf7889499afe7bad296bd488cc67f6.png

使用时间索引与含有标签的Numpy数组生成DataFrame

dates = pd.date_range('20200101',periods=7)
dates

9d7fb158e6719aa99821630fbe9e2105.png

使用随机数生成一个7*4的数据表。

9d8b58e3035c7d0b1a1c866954d59bc9.png

使用Series字典生成DataFrame

df2 = pd.DataFrame({'A':1.2,'B':pd.Series(1,index=list(range(4)),dtype='float32'),'C':pd.Timestamp('20200101'),'D':np.array([3]*4,dtype='int32'),'E':pd.Categorical(["test","tarin","test","train"]),'F':'foo'})
df2

4f45483ea1630c15bdd7501c8658253a.png

我们查看一下df2中每列的数据类型

df2.dtypes

6a4b7edb660fe8264ea5204a52302907.png

下面进入数据查看环节,查看数据的前几行和结尾几行的数据:

df.head()#默认是5行

4a68d1afcc9cb1c028a75bfa89fb6714.png
df.head(3)#可以输入数字查看相应行数

996b134b32018d3d34429b93a5da49be.png
df.tail(3)#查看最后3行

64b1be1a73355bb4e2aabeba9002111f.png

显示索引与列名

9bef0a3c19ed0a477ead82bbe9e475c7.png

快速的查看数据统计概要:

4e28fe124c4818228c5d9266a8d6dc18.png

数据转置:

4f48fddd38a9e3e6435e3e8c242efb29.png

提取数据

获取单列数据,选择单列,产生Series,与df.A 等效

74c2961241c0bfa98b97832e469df906.png

使用[ ]切片:

f6b37d0f8bb7eb28cacd4d329164f819.png

4aaf7e92cb05d1e127131033e3bd6818.png

按标签选择,用标签提取一行数据

ea2a832bb52f3b85c7ee482a6d8c4db9.png

用标签选择多列数据

c3b4a3b457d1745d87ecc92f3975a7bd.png

用标签切片,包含行与列结束点:

9d28f44c37699bd179ed160b5007a8e7.png

提取标量值:

826c4023f32841c828592c1e0e60ae73.png

使用整数位置选择

d1a347f55c53dd61e86d4e81a9043aac.png

类似 NumPy / Python,用整数切片:

99e278a622d74b79a81dc9ed6f8386bc.png

显示整行的切片:

77aa559690c0d7e15d0653c49a64cfb1.png

显示整列的切片:

1213c848f86520e2ffc85e08668f92d1.png

布尔索引,用单列的值选择数据:

4d53271f8a7ab36055f7e963281a58aa.png

提取出DataFrame 里满足条件的值:

36c16c868a2bbdc630d65b870ccf1fed.png

使用isin筛选:

814fdd585b83c4db53de22220c1e1bfe.png

用索引自动对齐新增列的数据:

a90d7c9136fc239e1500c4d1ccaeade4.png

按标签赋值:

2f59532ae66d3734fe785c2aab6aabba.png

按位置赋值

ab0e1b721de6ab8f8eda55f398e28b89.png

按 NumPy 数组赋值:

d4d633c5be6e9d22442466adcf1611e8.png

Pandas 主要用 np.nan 表示缺失数据,计算时,默认不包含空值。 重建索引(reindex)可以更改、添加、删除指定轴的索引,并返回数据副本,即不更改原数据。

08a21899aa19d18b2f7eacc894a12f49.png

删除所有包含空值的行:

dc79fb54e5db12fcee9157c76c7359d1.png

填充缺失值:

c18974a455112509fb3d1b84de26e898.png

计算均值:

4909c0c4895edd8218eafcbedd8e6eac.png

数值计数:

ae05399e0686f870a172046f9d4b0468.png

包含的字符串的处理功能str:

9cf50de375cd6a016ffb080764b97ca6.png

数据合并,pandas 提供了多种将 Series、DataFrame 对象组合在一起的功能,用索引与关联代数功能的多种设置逻辑可执行连接(join)与合并(merge)操作。

2727f86da056e5118033e7a91470dd59.png

为 DataFrame 追加行:

82e1bf77afd631089b8775180282fd7e.png

分组,“group by” 指的是涵盖下列一项或多项步骤的处理流程:

分割:按条件把数据分割成多组;

应用:为每组单独应用函数;

组合:将处理结果组合成一个数据结构。

6cf0365a037b87411f6b343979020e18.png

先分组,再用 sum()函数计算每组的汇总数据:

00870ba140b6553516d11aefac8b33ca.png

多列分组后,生成多层索引,也可以应用 sum 函数:

e532e3aa2c3d7910b25fd0c748ba54f0.png

以上为学习所得,希望对你有帮助。


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部