Pandas如何获取每个第n列
在本文中,我们将介绍如何通过Pandas从DataFrame中获取每个第n列。
有几种方法可以做到这一点。以下是两种常用的方法:
阅读更多:Pandas 教程
方法1 使用iloc
我们可以使用iloc方法和切片来获取每个第n列。
例如,如果我们想要获取每个第3列,我们可以使用:
import pandas as pd
# 创建一个DataFrame示例
data = {'Name':['John', 'Peter', 'Tina', 'Michael'],
'Age':[23, 21, 25, 27],
'City':['New York', 'Paris', 'Tokyo', 'London'],
'Country':['USA', 'France', 'Japan', 'England']}
df = pd.DataFrame(data)
# 获取每个第3列
df_n = df.iloc[:, 2::3]
print(df_n)
此输出将返回以下结果:
City
0 New York
1 Paris
2 Tokyo
3 London
以上代码中的::3
表示每个第3个元素。
方法2 使用loc
我们还可以使用loc方法,并使用step
参数获取每个第n列。例如,如果我们想要获取每3列,我们可以使用:
import pandas as pd
# 创建一个DataFrame示例
data={'Name':['John', 'Peter', 'Tina', 'Michael'],
'Age':[23, 21, 25, 27],
'City':['New York', 'Paris', 'Tokyo', 'London'],
'Country':['USA', 'France', 'Japan', 'England']}
df = pd.DataFrame(data)
# 获取每个第3列
df_n = df.loc[:, ::3]
print(df_n)
此输出将返回以下结果:
Name Country
0 John USA
1 Peter France
2 Tina Japan
3 Michael England
在这种情况下,::3
中的每个3
表示每3个元素。
总结
通过以上两种方法,我们可以很容易地提取DataFrame中的每个第n列。使用iloc和切片可以更精确地控制数据范围,而使用loc和step参数则可以使代码更易读。这些方法可帮助我们在数据分析的过程中更方便地处理数据。