如何在Python中使用Series字典创建数据帧?
Dataframe是一种二维数据结构,其中数据以行和列的形式以表格格式存储。
它可以被视为SQL数据表或Excel表格表示。它可以通过以下构造函数创建 –
pd.Dataframe(data, index, columns, dtype, copy)
让我们了解如何使用Series字典创建数据帧。
- Series是存在于”Pandas”库中的一维数据结构。
-
轴标签集体称为索引。
-
Series结构可以存储任何类型的数据,如整数,浮点数,字符串,Python对象等。
让我们看一个例子 –
更多Python相关文章,请阅读:Python 教程
示例
import pandas as pd
my_data = {'ab' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
'mn' : pd.Series([56, 78, 13, 13], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("从Series字典创建的数据帧:")
print(my_df)
输出
从Series字典创建的数据帧:
ab mn
a 1.0 56
b 2.0 78
c 3.0 13
d NaN 13
解释
- 所需的库已导入,并为易于使用而给出别名。
-
创建由键和值构成的字典值,其中的值实际上是Series数据结构。
-
这个Series字典稍后被传递为参数到’pandas’库中的’Dataframe’函数中。
-
通过将Series字典作为参数传递给数据帧来创建数据帧。
-
在控制台上打印数据帧。
注意 - “NaN”一词是“Not a Number”的缩写,表示指定的[row,col]值没有任何有效条目。