Pandas 从多个Series创建DataFrame

Pandas 从多个Series创建DataFrame

在本文中,我们将介绍如何使用Python的Pandas库通过多个Series来创建DataFrame。DataFrame是一种表格型的数据结构,可将数据存储为行和列,类似于电子表格或SQL中的表格。Series是一种一维数组,它可以存储数字、字符串、布尔值等数据类型。

我们可以使用Pandas的concat()函数将多个Series合并成一个DataFrame。concat()函数可以在一个轴上连接pandas对象,它具有许多参数,其中最重要的参数是objs,表示要连接的pandas对象的序列。

以下是一些示例,说明如何使用多个Series来创建DataFrame。

阅读更多:Pandas 教程

示例1:从两个Series创建DataFrame

首先,我们需要创建两个Series,即’Sales’和’Expenses’,分别表示销售额和支出。下面是创建两个Series的示例代码:

import pandas as pd

Sales = pd.Series([100, 200, 300])
Expenses = pd.Series([50, 75, 125])
Python

现在,我们将使用concat()函数将这两个Series合并成一个DataFrame。我们将设置axis参数为1,表示沿着列方向合并。以下是示例代码:

df = pd.concat([Sales, Expenses], axis=1)
print(df)
Python

输出结果如下:

   0    1
0  100   50
1  200   75
2  300  125
Python

现在我们可以看到创建的DataFrame包含两列,即’Sales’和’Expenses’。

示例2:从三个Series创建DataFrame

除了使用两个Series,我们还可以使用更多的Series来创建DataFrame。下面我们创建三个Series,分别表示销售额、支出和利润。以下是创建三个Series的示例代码:

Sales = pd.Series([100, 200, 300])
Expenses = pd.Series([50, 75, 125])
Profit = pd.Series([50, 125, 175])
Python

现在,我们将使用concat()函数将这三个Series合并成一个DataFrame。我们将设置axis参数为1,表示沿着列方向合并。以下是示例代码:

df = pd.concat([Sales, Expenses, Profit], axis=1)
print(df)
Python

输出结果如下:

   0    1    2
0  100   50   50
1  200   75  125
2  300  125  175
Python

现在我们可以看到创建的DataFrame包含三列,即’Sales’、’Expenses’和’Profit’。

示例3:从有不同索引的Series创建DataFrame

有时,如果我们从不同的Series创建DataFrame,则它们的索引可能不同。在这种情况下,我们需要使用merge()函数将它们合并为一个DataFrame。merge()函数可以根据一个或多个键将不同的DataFrame的行组合在一起。

以下是一个示例,说明如何从有不同索引的Series创建DataFrame。我们创建两个Series,即’Sales’和’Expenses’,其索引不同。下面是创建两个Series的示例代码:

Sales = pd.Series([100, 200, 300], index=['Jan', 'Feb', 'Mar'])
Expenses = pd.Series([50, 75, 125], index=['Feb', 'Mar', 'Apr'])
Python

现在,我们将使用merge()函数将这两个Series合并成一个DataFrame。我们将使用inner join,表示只有同时存在于每个索引中的值才会被保留。以下是示例代码:

df = pd.merge(Sales, Expenses, left_index=True, right_index=True, how='inner')
print(df)
Python

输出结果如下:

     0_x  0_y
Feb  200   50
Mar  300   75
Python

现在我们可以看到创建的DataFrame包含’Sales’和’Expenses’两列,只有索引为’Feb’和’Mar’的值被保留,因为这些值同时存在于每个Series中。

示例4:从字典创建DataFrame

除了使用多个Series,我们还可以从字典中创建DataFrame。我们可以使用字典的键作为列标签,字典的值作为要填充每列的数据。

以下是一个示例,说明如何从字典创建DataFrame。我们创建一个字典,其中包含’Sales’和’Expenses’两个列的数据。下面是创建字典的示例代码:

data = {'Sales': [100, 200, 300],
        'Expenses': [50, 75, 125]}
Python

现在,我们将使用DataFrame()函数从字典中创建一个DataFrame。以下是示例代码:

df = pd.DataFrame(data)
print(df)
Python

输出结果如下:

   Sales  Expenses
0    100        50
1    200        75
2    300       125
Python

现在我们可以看到创建的DataFrame具有’Sales’和’Expenses’两列,从字典中的数据填充。

总结

通过本文,我们学习了如何使用Python的Pandas库通过多个Series来创建DataFrame。我们使用concat()函数和merge()函数来合并不同的pandas对象,并使用DataFrame()函数从字典中创建DataFrame。这些示例说明了如何轻松创建DataFrame,这对于数据分析和机器学习非常有用。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册