Python Pandas 面板(Panel)
面板(Panel) 是一个3D的数据容器。术语 面板数据(Panel data) 来自计量经济学,部分地构成了Pandas这个名称 – pan(el)-da(ta) -s。
这3个轴的名称旨在为描述涉及面板数据的操作提供一些语义意义。它们是:
- items(项) - 轴0,每个项都对应一个包含其中的DataFrame。
-
major_axis(主轴) - 轴1,它是每个DataFrame的索引(行)。
-
minor_axis(次轴) - 轴2,它是每个DataFrame的列。
pandas.Panel()
可以使用以下构造函数创建一个Panel –
pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)
构造函数的参数如下-
参数 | 描述 |
---|---|
data | 数据可以是ndarray,series,map,lists,dict,constants以及另一个DataFrame形式 |
items | 按axis=0排列 |
major_axis | 按axis=1排列 |
minor_axis | 按axis=2排列 |
dtype | 每列数据的数据类型 |
copy | 复制数据。默认值为 false |
创建面板
可以通过多种方式创建面板,如下所示:
- 通过ndarrays
- 通过DataFrame字典
从3D ndarray创建
# creating an empty panel
import pandas as pd
import numpy as np
data = np.random.rand(2,4,5)
p = pd.Panel(data)
print p
它的 输出 如下:
<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4
Note - 观察空面板和上面的面板的尺寸,所有对象都不同。
从DataFrame对象的字典中
#creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p
它的 输出 如下:
Dimensions: 2 (items) x 4 (major_axis) x 3 (minor_axis)
Items axis: Item1 to Item2
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 2
创建一个空面板
可以使用Panel构造函数创建一个空面板,如下所示 −
#creating an empty panel
import pandas as pd
p = pd.Panel()
print p
它的 输出 如下-
<class 'pandas.core.panel.Panel'>
Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)
Items axis: None
Major_axis axis: None
Minor_axis axis: None
从面板中选择数据
使用以下方式从面板中选择数据:
- Items
- Major_axis
- Minor_axis
使用Items
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p['Item1']
它的 输出 如下:
0 1 2
0 0.488224 -0.128637 0.930817
1 0.417497 0.896681 0.576657
2 -2.775266 0.571668 0.290082
3 -0.400538 -0.144234 1.110535
我们有两个项目,并且我们检索到了项目1。结果是一个具有4行和3列的DataFrame,分别是 主轴 和 次轴 的维度。
使用主轴
可以使用方法 面板.主轴(索引) 来访问数据。
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.major_xs(1)
其 输出 如下所示 –
Item1 Item2
0 0.417497 0.748412
1 0.896681 -0.557322
2 0.576657 NaN
使用 minor_axis
可以使用方法 panel.minor_axis(index) 来访问数据。
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.minor_xs(1)
它的 输出 如下:
Item1 Item2
0 -0.128637 -1.047032
1 0.896681 -0.557322
2 0.571668 0.431953
3 -0.144234 1.302466
注意 − 观察尺寸的变化。