Pandas返回索引
在pandas中,索引是非常重要的数据结构,它可以帮助我们快速访问、操作和筛选数据。在这篇文章中,我们将详细介绍如何使用pandas返回索引,包括如何获取、设置和重置索引。
什么是索引
在pandas中,索引类似于字典中的键,它帮助我们对数据进行标记和访问。每个索引都对应着一个数据值,这样我们可以通过索引来定位和操作对应的数值。
创建一个简单的DataFrame
首先,让我们创建一个简单的DataFrame来演示如何使用索引。我们将创建一个包含学生信息的DataFrame,其中包括学生姓名、年龄和成绩。
import pandas as pd
data = {
'姓名': ['张三', '李四', '王五', '赵六'],
'年龄': [20, 21, 22, 23],
'成绩': [85, 90, 88, 92]
}
df = pd.DataFrame(data)
print(df)
输出如下:
姓名 年龄 成绩
0 张三 20 85
1 李四 21 90
2 王五 22 88
3 赵六 23 92
返回默认索引
当我们创建DataFrame时,pandas会默认为我们生成一个整数型索引,从0开始递增,这样我们就可以通过整数索引来访问DataFrame中的数据。
print(df.index)
输出如下:
RangeIndex(start=0, stop=4, step=1)
上面的结果表明,该DataFrame的索引是一个从0到3的整数范围。
返回自定义索引
有时候,我们也可以自定义索引来更好地标记数据。我们可以在创建DataFrame时指定index参数,将自定义的索引加入到DataFrame中。
index = ['s1', 's2', 's3', 's4']
df = pd.DataFrame(data, index=index)
print(df)
输出如下:
姓名 年龄 成绩
s1 张三 20 85
s2 李四 21 90
s3 王五 22 88
s4 赵六 23 92
现在我们的DataFrame中的索引变成了自定义的s1、s2、s3和s4。
通过索引访问数据
我们可以通过loc和iloc属性来访问DataFrame中的数据。loc用于通过标签索引访问数据,而iloc用于通过整数索引访问数据。
# 通过标签索引访问数据
print(df.loc['s1'])
# 通过整数索引访问数据
print(df.iloc[0])
输出如下:
姓名 张三
年龄 20
成绩 85
Name: s1, dtype: object
姓名 张三
年龄 20
成绩 85
Name: s1, dtype: object
设置新索引
如果我们想要修改DataFrame中的索引,可以使用set_index方法来设置新的索引。
df_new = df.set_index('姓名')
print(df_new)
输出如下:
年龄 成绩
姓名
张三 20 85
李四 21 90
王五 22 88
赵六 23 92
现在DataFrame的索引变为了姓名,我们可以通过姓名来访问数据。
重置索引
有时候我们需要将索引还原为默认的整数索引,可以使用reset_index方法来重置索引。
df_reset = df_new.reset_index()
print(df_reset)
输出如下:
姓名 年龄 成绩
0 张三 20 85
1 李四 21 90
2 王五 22 88
3 赵六 23 92
现在索引已经恢复为默认的整数索引了。
总结
本文介绍了如何在pandas中返回索引,包括了获取默认索引、自定义索引、访问数据、设置新索引和重置索引等操作。