Pandas 将多列值合并为一列|极客教程

Pandas 将多列值合并为一列

在本文中，我们将学习如何使用Python Pandas库将多列数据合并为一列。在数据分析过程中，我们经常会遇到需要将多个列合并为单个列的情况。由于Pandas库具有出色的数据处理功能，因此它可以轻松地处理这种情况。

情况1：将两列合并到一列

如果我们想将两个列合并为一个列，则可以使用Pandas.concat()方法。这个方法接受一个参数axis，它表示在哪个方向上进行合并。如果将它设置为“axis=1”，则它将沿水平轴（即列）进行合并。

例如，假设我们有一个包含两个列的数据帧，它们是“Name”和“City”。我们想将这两列合并到一个名为“Details”的列中。

import pandas as pd

df = pd.DataFrame({'Name': ['John', 'Khan'], 'City': ['Lima', 'Beijing']})
print(df)

#     Name     City
# 0   John     Lima
# 1   Khan  Beijing

df['Details'] = df['Name'] + ', ' + df['City']
print(df)

#     Name     City           Details
# 0   John     Lima        John, Lima
# 1   Khan  Beijing  Khan, Beijing

情况2：将多列合并到一列

如果要将多个列合并到一个列中，则可以使用df.apply()方法。

考虑以下数据帧，其中我们有四列“Section1”，“Section2”，“Section3”和“Section4”。

df = pd.DataFrame({'Section1': ['A', 'B', 'C'], 'Section2': ['D', 'E', 'F'],
                   'Section3': ['G', 'H', 'I'], 'Section4': ['J', 'K', 'L']})

#   Section1 Section2 Section3 Section4
# 0        A        D        G        J
# 1        B        E        H        K
# 2        C        F        I        L

要将这四列合并到一个名为“Details”的列中，请使用df.apply()方法如下所示：

def combine_sections(row):
    return ', '.join(row.values.astype(str))

df['Details'] = df.apply(lambda row: combine_sections(row), axis=1)

print(df)

#   Section1 Section2 Section3 Section4             Details
# 0        A        D        G        J  A, D, G, J
# 1        B        E        H        K  B, E, H, K
# 2        C        F        I        L  C, F, I, L