Pandas如何将DataFrame转换为分层字典

在本文中，我们将介绍如何使用Python的Pandas库将DataFrame对象转换为分层字典。Pandas是一个数据分析和操作工具，它提供了用于处理结构化数据的高性能数据结构和数据分析工具。

什么是分层字典？

分层字典是一种具有多个层级的字典结构，其中每个层级都包含一个键值对。这种结构非常适用于存储和操作层次化的数据，例如树形结构或多层次的数据结构。

使用`to_dict()`方法将DataFrame转换为字典

Pandas的DataFrame对象具有to_dict()方法，可以用于将DataFrame转换为字典。默认情况下，此方法将返回一个由列名作为键和列值作为值的字典。例如，考虑以下DataFrame：

import pandas as pd

data = {'Name': ['John', 'Emma', 'Peter', 'Liam'],
        'Age': [25, 28, 32, 30],
        'City': ['New York', 'Paris', 'London', 'Sydney']}
df = pd.DataFrame(data)

我们可以使用to_dict()方法将此DataFrame转换为字典，如下所示：

df_dict = df.to_dict()

转换后的字典输出如下：

{'Name': {0: 'John', 1: 'Emma', 2: 'Peter', 3: 'Liam'},
 'Age': {0: 25, 1: 28, 2: 32, 3: 30},
 'City': {0: 'New York', 1: 'Paris', 2: 'London', 3: 'Sydney'}}

如上所述，默认情况下to_dict()方法返回的字典是单层结构，其中列名作为键，列值作为值。

使用`orient`参数创建分层字典

要将DataFrame转换为分层字典，我们可以使用orient参数，并将其设置为”index”。这将导致字典使用行索引作为主键，并为每个主键分配一个嵌套的字典。以下是示例代码：

df_dict = df.to_dict(orient='index')

转换后的字典将如下所示：

{0: {'Name': 'John', 'Age': 25, 'City': 'New York'},
 1: {'Name': 'Emma', 'Age': 28, 'City': 'Paris'},
 2: {'Name': 'Peter', 'Age': 32, 'City': 'London'},
 3: {'Name': 'Liam', 'Age': 30, 'City': 'Sydney'}}

如上所述，每个行索引都被分配给一个嵌套字典，并且每个列名都作为该字典的键，对应的值作为该键的值。

使用`orient`参数创建多层分层字典

如果要将DataFrame转换为具有多个层级的分层字典，我们可以使用orient参数并将其设置为”records”。这将导致字典的每个元素都是一个嵌套字典，其中包含行记录的多个层级。以下是示例代码：

df_dict = df.to_dict(orient='records')

转换后的字典将如下所示：

[{'Name': 'John', 'Age': 25, 'City': 'New York'},
 {'Name': 'Emma', 'Age': 28, 'City': 'Paris'},
 {'Name': 'Peter', 'Age': 32, 'City': 'London'},
 {'Name': 'Liam', 'Age': 30, 'City': 'Sydney'}]

如上所述，每个元素都是一个嵌套字典，其中包含行记录的多个层级。

使用`stack()`方法创建分层字典

除了使用to_dict()方法之外，我们还可以使用Pandas的stack()方法来创建分层字典。stack()方法将DataFrame转换为一个层次化的Series对象，然后我们可以使用to_dict()方法将其转换为字典。以下是示例代码：

stacked = df.stack()
df_dict = stacked.to_dict()

转换后的字典输出如下所示：

{('Name', 0): 'John',
 ('Name', 1): 'Emma',
 ('Name', 2): 'Peter',
 ('Name', 3): 'Liam',
 ('Age', 0): 25,
 ('Age', 1): 28,
 ('Age', 2): 32,
 ('Age', 3): 30,
 ('City', 0): 'New York',
 ('City', 1): 'Paris',
 ('City', 2): 'London',
 ('City', 3): 'Sydney'}

如上所述，每个键都是一个由列名和行索引组成的元组，对应的值是该元组对应的单元格的值。

将DataFrame转换为嵌套分层字典

如果要创建一个嵌套的分层字典，其中每个层级都由特定的列值对应，我们可以使用Pandas的groupby()和apply()方法。groupby()方法用于将DataFrame按照某一列的值进行分组，然后我们可以使用apply()方法对每个分组应用一个函数来创建嵌套字典。以下是示例代码：

nested_dict = df.groupby('City').apply(lambda x: x[['Name', 'Age']].to_dict(orient='records')).to_dict()

转换后的嵌套字典输出如下所示：

{'London': [{'Name': 'Peter', 'Age': 32}],
 'New York': [{'Name': 'John', 'Age': 25}],
 'Paris': [{'Name': 'Emma', 'Age': 28}],
 'Sydney': [{'Name': 'Liam', 'Age': 30}]}

如上所述，每个城市作为嵌套字典的键，对应的值是该城市下的所有人的字典列表。

总结

本文介绍了如何使用Pandas将DataFrame转换为分层字典。我们通过to_dict()方法以及orient参数的不同值实现了不同层级的分层字典转换。我们还使用了stack()方法将DataFrame转换为层次化的Series对象，然后再将其转换为字典。最后，我们还介绍了如何通过使用groupby()和apply()方法创建了嵌套的分层字典。

希望本文对您理解如何将Pandas DataFrame转换为分层字典是有帮助的。通过灵活应用这些技巧，您可以更方便地处理和操作层次化的数据结构。