在Pandas中折叠多个列
在Pandas中操作数据框架时,我们可能会遇到要折叠列的情况。让它成为
多列的累积数据或基于其他一些要求的折叠。让我们来看看如何在Pandas中折叠多列。
以下是在Pandas中折叠多列需要遵循的步骤。
第一步:加载numpy和Pandas。
第二步:创建随机数据,并使用它们来创建一个pandas数据框架。
第三步:将多个列表转换成一个数据框架,为每个列表创建一个带有名称的字典。
第四步:然后使用Pandas的数据框架进入dict。一个带有数据列和名称列的数据框架就准备好了。
第五步:指定哪些列要被折叠。这可以通过将映射指定为一个字典来完成,其中键是要合并或折叠的列的名称,值是结果列的名称。
示例 1:
# Python program to collapse
# multiple Columns using Pandas
import pandas as pd
# sample data
n = 3
Sample_1 = [57, 51, 6]
Sample_2 = [92, 16, 19]
Sample_3 = [15, 93, 71]
Sample_4 = [28, 73, 31]
sample_id = zip(["S"]*n, list(range(1, n + 1)))
s_names = [''.join([w[0], str(w[1])]) for w in sample_id]
d = {'s_names': s_names, 'Sample_1': Sample_1,
'Sample_2': Sample_2, 'Sample_3': Sample_3,
'Sample_4': Sample_4}
df_1 = pd.DataFrame(d)
mapping = {'Sample_1': 'Result_1',
'Sample_2': 'Result_1',
'Sample_3': 'Result_2',
'Sample_4': 'Result_2'}
df = df_1.set_index('s_names').groupby(mapping, axis = 1).sum()
df.reset_index(level = 0)
输出:
示例 2:
# Python program to collapse
# multiple Columns using Pandas
import pandas as pd
df = pd.DataFrame({'First': ['Manan ', 'Raghav ', 'Sunny '],
'Last': ['Goel', 'Sharma', 'Chawla'],
'Age':[12, 24, 56]})
mapping = {'First': 'Full Name', 'Last': 'Full Name'}
df = df.set_index('Age').groupby(mapping, axis = 1).sum()
df.reset_index(level = 0)
输出: