Pandas中的“合并”操作

Pandas中的“合并”操作

在本文中,我们将介绍如何在Pandas DataFrame 中将两个列组合在一起。

阅读更多:Pandas 教程

初始数据

首先,我们先用以下代码创建一个基础数据,包含两列数据信息:

import pandas as pd

data = {'A': [1, 2, 3, 4],
        'B': [5, 6, 7, 8]}
df = pd.DataFrame(data)
print(df)
Python

执行结果为:

   A  B
0  1  5
1  2  6
2  3  7
3  4  8
Python

这个例子中有两列数据:A和B。

使用+号操作符合并两列

在Pandas DataFrame 中,我们可以通过使用+号操作符将两列数据合并在一起:

df['C'] = df['A'] + df['B']
print(df)
Python

执行结果为:

   A  B   C
0  1  5   6
1  2  6   8
2  3  7  10
3  4  8  12
Python

如上结果,我们将两列数据A和B合并到了新一列数据C中。每行中值C中的数据为对应行A,B数据之和。

使用.apply()函数操作实现两列合并

我们可以将一个自定义函数应用到一列或多列数据上。以下是一个将列A和B合并在一起的自定义函数:

def join_columns(row):
    return str(row['A']) + '-' + str(row['B'])

df['C'] = df.apply(join_columns, axis=1)
print(df)
Python

执行结果为:

   A  B    C
0  1  5  1-5
1  2  6  2-6
2  3  7  3-7
3  4  8  4-8
Python

如上结果,我们创建了一个名为join_columns的函数。该函数没有什么特定的用途,仅仅是将A列和B列连接为一个字符串,用“-”分隔。

接着,我们将该函数应用到DataFrame中的每一行,合并A列和B列,完成一个新列的创建。

使用.agg()函数操作实现两列合并

我们还可以使用.agg()函数对DataFrame进行操作,实现两列合并:

df['C'] = df.agg(lambda x: '{}_{}'.format(x['A'], x['B']), axis=1)
print(df)
Python

执行结果为:

   A  B    C
0  1  5  1_5
1  2  6  2_6
2  3  7  3_7
3  4  8  4_8
Python

如上结果,我们使用lambda函数将列A和列B合并在一起,结果是字符串格式并使用下划线分隔。

总结

本文介绍了在Pandas中将两列数据合并到一起的三种方法,包括使用+号操作符、apply()函数和.agg()函数。使用这些方法,我们可以轻松地将两个列中的数据合并在一起,并创建一个新的列来存储它们的组合数据。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册