Pandas 将数据框转换为系列

Pandas 将数据框转换为系列

在本文中,我们将介绍如何使用 PandasPandas 数据框转换为 Pandas 系列。在数据分析中,时常需要将数据框中的某一列单独提取出来进行操作,此时就需要转换为 Pandas 系列。

阅读更多:Pandas 教程

什么是 Pandas 系列?

Pandas 系列是一维数组,可以存储任何数据类型(整数、字符串、浮点数、Python 对象等)。每个元素都有一个索引,与其他 Python 序列不同的是,Pandas 系列可以根据标签进行索引。

示例:

import pandas as pd

data = {'Name': ['Tom', 'John', 'Alice', 'Danny'], 'Age': [25, 18, 32, 21]}

df = pd.DataFrame(data)

# 获取 Name 列并转换为系列
series = df['Name']
print(series)
Python

输出:

0      Tom
1     John
2    Alice
3    Danny
Name: Name, dtype: object
Python

将 Pandas 数据框转换为 Pandas 系列非常简单,只需要对数据框进行索引即可。

series = df['Name']
Python

转换原理

在 Pandas 中,数据框使用二维 NumPy 数组存储数据,而 Pandas 系列则使用一维的 NumPy 数组。当我们对数据框进行索引时,Pandas 会将该列转换为 Pandas 系列并返回。

如果要同时获取多个列,可以将列名放入列表中进行索引。

name_age = df[['Name', 'Age']]
Python

示例:计算均值

我们使用以下数据框示例:

import pandas as pd

data = {'Name': ['Tom', 'John', 'Alice', 'Danny'], 'Age': [25, 18, 32, 21]}

df = pd.DataFrame(data)
Python

我们获取 Age 列并计算均值:

age_series = df['Age']
age_mean = age_series.mean()

print('平均年龄:', age_mean)
Python

输出:

平均年龄: 24.0
Python

修改索引

在 Pandas 中可以使用 set_index() 方法更改 Pandas 系列的索引为数据框的其他列。

# 使用 Name 列作为索引
df.set_index('Name', inplace=True)
Python

总结

将 Pandas 数据框转换为 Pandas 系列非常简单,只需要对数据框进行索引即可。采用 Pandas 系列能够在数据分析和处理过程中提高效率和准确度,因此值得掌握。同时,我们还介绍了如何计算 Pandas 系列的均值和修改 Pandas 系列的索引。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册