查找Excel文件重复数据

最近工作需要用到把Excel中的重复数据查找,一个Excel文件一般几万条数据,不好查找,然后就用python的pandas库写了个脚本,查找起来就方便很多,也是丰富自己知识,学习的一个过程。

# 欢迎添加 vx公众号 小刘和他的Python 一起学习
import pandas as pd
df = pd.read_excel(r"D:/dup/dept.xls",usecols=[1,2],sheet_name="Sheet1")
dup=df.duplicated()
print("重复数据:\n",df[dup])

usecols=[1,2] 表示查找的数据列为年龄列和籍贯列,列数据编号重0开始,姓名列编号为0

sheet_name=“Sheet1” 表示查询的数据为sheet1 页的数据
在这里插入图片描述


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部