Pandas 选择数据,虽然用于选择和赋值的标准Python / Numpy
表达式非常直观,并且便于交互工作,但是对于生产环境的代码,我们推荐优化的 Pandas 数据访问方法.at
、 .iat
、.loc
和.iloc
。
学习本章内容,可以先了解pandas 基础教程
获取
选择一个列,产生一个“Series”,相当于“df.A”,如下所示:
输出结果如下:
通过[ ]
选择,对行进行切片,如下所示:
输出结果如下:
按标签选择
通过标签获取一行数据,如下所示:
输出结果如下:
通过标签在多个轴上选择数据,如下所示:
输出结果如下:
通过标签同时在两个轴上切片:
输出结果如下:
减小返回对象的大小:
输出结果如下:
获取标量值:
输出结果如下:
快速访问标量(和上面的方法效果相同):
输出结果如下:
按位置选择
通过传递的整数的位置选择:
输出结果如下:
通过整数切片,类似于numpy/Python:
输出结果如下:
通过传递整数的列表按位置切片,类似于numpy/Python:
输出结果如下:
整行切片:
输出结果如下:
整列切片:
输出结果如下:
获取具体值:
输出结果如下:
快速访问标量(等价于之前的方法):
输出结果如下:
布尔索引
使用单个列的值来选择数据:
输出结果如下:
从满足布尔条件的DataFrame中选择值:
输出结果如下:
使用 isin()
方法过滤:
输出结果如下:
赋值
添加新列将自动根据索引对齐数据,如下所示:
输出结果:
通过标签赋值:
通过位置赋值:
使用NumPy数组赋值:
带有where
条件的赋值操作:
输出结果如下:
更多pandas知识点,请参考:
Pandas 教程
Pandas数据处理
Pandas 数据读写