首页 > 编程笔记

Pandas Series对象重点方法介绍

Series 还包含了其他一些方法,比如查看部分数据的方法 head 和 tail、取样方法 sample、条件筛选方法 where 和 mask,以及判断是否在另一个序列中的 isin 方法。示例代码如下。
In [1]: import pandas as pd
In [2]: a=pd.Series([0,1,2,3])

1. 查看序列头部尾部元素

在数据量比较大的情况下,我们可以使用 head 和 tail 方法返回数据库中部分样本,用于观察。
In [3]: a.head(3)  # 查看前3个元素
Out[3]: 
0    0
1    1
2    2
dtype: int64
In [4]: a.tail(3)  # 查看后3个元素
Out[4]: 
1    1
2    2
3    3
dtype: int64

2. 序列随机取样sample

与 Numpy 中的 choice 方法类似,对序列中的样本取样。
In [5]: a.sample(3)  # 随机取样
Out[5]: 
2    2
1    1
0    0
dtype: int64

3. 条件查询where与mask

与 Numpy 中的 where 方法类似,做条件查询。
In [6]: a.where(a>0)  # 查看大于0的元素
Out[6]: 
0    NaN 
1    1.0
2    2.0
3    3.0
dtype: float64

mask 方法与 where 方法的结果正好相反。
In [7]: a.mask(a>0)  # 与where相反
Out[7]: 
0    0.0
1    NaN
2    NaN
3    NaN
dtype: float64

4. isin输出序列重复部分

与 Python 中自带的in方法类似,查看两个序列中重复的部分。
In [8]: a.isin([1,"a"])  # 查看是否在另一个序列中出现
Out[8]: 
0    False
1     True
2    False
3    False
dtype: bool

优秀文章