Pandas 通过位置选择列
在本文中,我们将介绍如何使用 Pandas 按位置选择数据框中的列。这是一个非常常见的操作,尤其是当你有很多列时。
阅读更多:Pandas 教程
iloc 方法
Pandas 提供了一个 iloc 方法,用于按位置选择数据框中的行或列。下面是一些示例:
import pandas as pd
# 创建数据框
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'salary': [50000, 60000, 70000, 80000]}
df = pd.DataFrame(data)
# 选择第一列
df.iloc[:, 0]
# 选择第一列和第三列
df.iloc[:, [0, 2]]
# 选择最后一列
df.iloc[:, -1]
# 选择第二行
df.iloc[1, :]
# 选择第二行和第四行
df.iloc[[1, 3], :]
# 选择第二行和最后一列
df.iloc[1, -1]
在这个示例中,我们创建了一个包含名称、年龄和薪水的数据框。然后,我们使用 iloc 方法按位置选择了不同的行和列。
.iloc[] 与 .loc[] 方法的区别
.iloc[] 和 .loc[] 方法都可以按行和列选择数据框。它们之间的不同在于,.iloc[] 方法使用整数索引,而 .loc[] 方法使用标签索引。下面是一些示例:
import pandas as pd
# 创建数据框
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'salary': [50000, 60000, 70000, 80000]}
df = pd.DataFrame(data)
# 使用 loc 方法选择列
df.loc[:, 'name']
# 使用 iloc 方法选择列
df.iloc[:, 0]
# 使用 loc 方法选择行
df.loc[1, :]
# 使用 iloc 方法选择行
df.iloc[1, :]
请注意,.loc[] 方法使用标签名选择行和列,而 .iloc[] 方法使用整数位置选择行和列。
使用整数列表选择列
除了使用 .iloc[] 方法选择列之外,你还可以使用整数列表,如下所示:
import pandas as pd
# 创建数据框
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'salary': [50000, 60000, 70000, 80000]}
df = pd.DataFrame(data)
# 选择第一列
df[[df.columns[0]]]
# 选择第一列和第三列
df[[df.columns[0], df.columns[2]]]
# 选择最后一列
df[[df.columns[-1]]]
在这个示例中,我们使用 df.columns 列出了所有的列名,并选择了一些列。
总结
在本文中,我们介绍了如何使用 Pandas 按位置选择数据框中的列。我们学习了 iloc 方法、.iloc[] 与 .loc[] 方法之间的区别以及使用整数列表选择列。这些技术都非常有用,在数据分析和处理中很常见。
极客教程