Python学习笔记#8:Pandas
文章目录
- Pandas 简介
- 安装
- 必要包
- 基本用法
- 数据结构
- 数据导入
- 数据导出
- 数据清洗
- 分组
- 案例1:excel表格多行合一
- 要求
- 思路
- 代码
- 效果图
- 踩过的坑
- 案例2:多级分组
Pandas 简介
Pandas是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。
Pandas是NumFOCUS赞助的项目。这将有助于确保Pandas成为世界级开源项目的成功,并有可能捐赠给该项目。
安装
pip install Pandas -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
必要包
import Pandas as pd
import numpy as np
基本用法
数据结构
Series
一维数组,也称序列,与numpy中的一维array类似,与基本数据结构list也很接近。
用于储存一行或一列的数据,以及与之相关的索引的集合。
Series([数据1, 数据2, ...], index = [索引1, 索引2, ...])
>>> import numpy as np
>>> import pandas as pd
>>> x = pd.Series(data = ['a',2,True], index = [1,2,3])
>>> x
1 a
2 2
3 True
dtype: object# 读取
>>> x[3]
True# 如果不指定index,默认从0开始
>>> l = np.random.randint(10, 20, size=5
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
