python pd Series 添加行_python操作数据库到pandas清洗quot;赃quot;数据

e11a2924e80d12a9635f1349251b1428.png

一 python操作数据库

# coding: utf-8

二 pandas清洗数据

  • 一览数据面貌
df

c0a7642d7e0d3230464858715cb1793e.png
获取查询数据末尾5行
  • pd.value_counts(Series)统计Series中不同元素出现的次数
data

4fe5682a58730c767664ca603f110a1e.png
各个年级出现的次数
  • reset_index将serives转化为dataframe
data=data.reset_index()

5a50bfc62c5cc24c3d77c7e3fb1a8710.png
  • duplicated 定位重复
series.duplicated(keep='first')
判断series是否有重复值,标记第一次出现以后的数据为重复
series.duplicated(keep='last')
标记最后一个出现之前的数据为重复 重复=False 否则=True
i) df.duplicated()#判断所有列
ii) df.duplicated('col1')#判断col1
iii) df.duplicated(['col1','col2'])#判断col1,col2
  • 取值(根绝列的值选取多行数据)
df

ddb8497578cbce821ab54c497756c662.png
单条件取值

ca5977ba197df5945cf4040a7e6dcd65.png
多条件取值
pd.merge(df,data,left_on='grade',right_on='index',how='left')
# 次操作类似于excel中的vlookup函数,又能将他和数据库中left join联系起来,
# 此时你有没有想到数据库还有inner join,right join等连接方式,bingo,改变how后面的left参数就ok了

d5314f3896b3ba26ee0e741a277d6853.png
将原数据df与data进行匹配
今年的笔记都到这里了,希望对困扰的你有帮助哦,同时同步给大家一个"吉德林法则",把难题清清楚楚地写出来,问题便已经解决了一半。希望大家在遇到难题时将自己的想法、思维从点连城线,用纸简单的写下来,或者用思维导图画出来,抑或讲给人挺,那问题就已经决绝了一半了


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部