Python Pandas 面板(Panel)

Python Pandas 面板(Panel)

面板(Panel) 是一个3D的数据容器。术语 面板数据(Panel data) 来自计量经济学,部分地构成了Pandas这个名称 – pan(el)-da(ta) -s。

这3个轴的名称旨在为描述涉及面板数据的操作提供一些语义意义。它们是:

  • items(项) - 轴0,每个项都对应一个包含其中的DataFrame。

  • major_axis(主轴) - 轴1,它是每个DataFrame的索引(行)。

  • minor_axis(次轴) - 轴2,它是每个DataFrame的列。

pandas.Panel()

可以使用以下构造函数创建一个Panel –

pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)

构造函数的参数如下-

参数 描述
data 数据可以是ndarray,series,map,lists,dict,constants以及另一个DataFrame形式
items 按axis=0排列
major_axis 按axis=1排列
minor_axis 按axis=2排列
dtype 每列数据的数据类型
copy 复制数据。默认值为 false

创建面板

可以通过多种方式创建面板,如下所示:

  • 通过ndarrays
  • 通过DataFrame字典

从3D ndarray创建

# creating an empty panel
import pandas as pd
import numpy as np

data = np.random.rand(2,4,5)
p = pd.Panel(data)
print p

它的 输出 如下:

<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4

Note - 观察空面板和上面的面板的尺寸,所有对象都不同。

从DataFrame对象的字典中

#creating an empty panel
import pandas as pd
import numpy as np

data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p

它的 输出 如下:

Dimensions: 2 (items) x 4 (major_axis) x 3 (minor_axis)
Items axis: Item1 to Item2
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 2

创建一个空面板

可以使用Panel构造函数创建一个空面板,如下所示 −

#creating an empty panel
import pandas as pd
p = pd.Panel()
print p

它的 输出 如下-

<class 'pandas.core.panel.Panel'>
Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)
Items axis: None
Major_axis axis: None
Minor_axis axis: None

从面板中选择数据

使用以下方式从面板中选择数据:

  • Items
  • Major_axis
  • Minor_axis

使用Items

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p['Item1']

它的 输出 如下:

0          1          2
0    0.488224  -0.128637   0.930817
1    0.417497   0.896681   0.576657
2   -2.775266   0.571668   0.290082
3   -0.400538  -0.144234   1.110535

我们有两个项目,并且我们检索到了项目1。结果是一个具有4行和3列的DataFrame,分别是 主轴次轴 的维度。

使用主轴

可以使用方法 面板.主轴(索引) 来访问数据。

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.major_xs(1)

输出 如下所示 –

Item1       Item2
0   0.417497    0.748412
1   0.896681   -0.557322
2   0.576657       NaN

使用 minor_axis

可以使用方法 panel.minor_axis(index) 来访问数据。

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
   'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.minor_xs(1)

它的 输出 如下:

Item1       Item2
0   -0.128637   -1.047032
1    0.896681   -0.557322
2    0.571668    0.431953
3   -0.144234    1.302466

注意 − 观察尺寸的变化。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程