Pandas中如何将列表存储在Dataframe中

在本文中，我们将介绍Pandas中如何将列表存储在Dataframe中。Pandas是一个流行的数据分析库，它提供了一些功能强大而灵活的数据结构，如Dataframe和Series。Dataframe是一种二维表格数据结构，可以轻松处理结构化和标签数据，而列表则是一种包含多个元素的可变序列。在某些情况下，将列表存储在Dataframe中是很有用的。

阅读更多：Pandas 教程

在Dataframe的单元格中存储列表

将列表存储在Dataframe中的一种方法是将其存储在Dataframe的一个单元格中。在Pandas中，我们可以通过使用Python的列表数据类型或NumPy的数组数据类型创建Dataframe。我们首先需要创建一个包含列表的Python字典，然后使用字典创建Dataframe。例如：

import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [['a', 'b'], ['c'], ['d', 'e', 'f']]}
df = pd.DataFrame(data)

print(df)

输出结果如下所示：

	col1	col2
0	1	[a, b]
1	2	[c]
2	3	[d, e, f]

在上面的例子中，Dataframe有两列：col1和col2。其中，col2列包含了三个列表，每个列表都存储在一个单元格中。我们可以看到，Pandas用方括号来表示列表。

列表展开成不同的行

要展开列表并使其成为Dataframe中的不同行，我们可以使用Pandas的explode()函数。该函数能够将嵌套序列拆分成不同的行。例如：

import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [['a', 'b'], ['c'], ['d', 'e', 'f']]}
df = pd.DataFrame(data)

df_exploded = df.explode('col2')

print(df_exploded)

输出结果如下所示：

	col1	col2
0	1	a
0	1	b
1	2	c
2	3	d
2	3	e
2	3	f

在上面的例子中，我们使用explode()函数将col2列展开成不同的行。输出结果是展开后的Dataframe，其中每个列表值都成为一行，重复其他数据。由于列表元素的数量不同，因此新的数据中的行数可能会增加。

列表拆分成多个列

如果列表中的元素可以拆分成多个列，则我们可以将列表拆分成多个列并将其添加到Dataframe中。这可以通过将列表转换成Series并将其与Dataframe连接来实现。例如：

import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [['a', 'b'], ['c'], ['d', 'e', 'f']]}
df = pd.DataFrame(data)

# 将col2列的列表拆分为三列并添加到df中
df[['col2_1', 'col2_2', 'col2_3']] = pd.DataFrame(df.col2.tolist(), index=df.index)

# 删除原始列表列
df = df.drop(columns=['col2'])

print(df)