Python Pandas 面板
Panel 是一个三维的数据容器。 面板数据 这一术语来自于计量经济学,这也是pandas这一名称的部分原因 --pan(el)-da(ta) -s。
3个轴的名字是为了给描述涉及面板数据的操作提供一些语义。它们是 –
- items – 轴0,每个项目对应于里面包含的一个DataFrame。
-
major_axis - 轴1,它是每个数据框架的索引(行)。
-
minor_axis – 轴2,它是每个数据框架的列。
pandas.Panel()
可以使用下面的构造函数来创建一个面板
pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)
构造函数的参数如下:
参数 | 描述 |
---|---|
data | 数据有多种形式,如ndarray, series, map, lists, dict, constants和另一个DataFrame |
items | axis=0 |
major_axis | axis=1 |
minor_axis | axis=2 |
dtype | 每一列的数据类型 |
copy | 复制数据。默认情况下, false |
创建面板
可以用多种方式创建一个面板,例如
- 从ndarrays
- 从DataFrames的dict中
从三维ndarray中
# creating an empty panel
import pandas as pd
import numpy as np
data = np.random.rand(2,4,5)
p = pd.Panel(data)
print p
其 输出结果 如下 –
<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4
注意 - 观察空面板和上述面板的尺寸,所有对象都是不同的。
从DataFrame对象的口述
#creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p
其 输出结果 如下 –
Dimensions: 2 (items) x 4 (major_axis) x 3 (minor_axis)
Items axis: Item1 to Item2
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 2
创建一个空的面板
可以使用面板构造函数来创建一个空的面板,如下所示
#creating an empty panel
import pandas as pd
p = pd.Panel()
print p
其 输出结果 如下 –
<class 'pandas.core.panel.Panel'>
Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)
Items axis: None
Major_axis axis: None
Minor_axis axis: None
从小组中选择数据
从面板上选择数据,使用 –
- 项目
- 主轴
- 小轴
使用Items
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p['Item1']
其 输出结果 如下 –
0 1 2
0 0.488224 -0.128637 0.930817
1 0.417497 0.896681 0.576657
2 -2.775266 0.571668 0.290082
3 -0.400538 -0.144234 1.110535
我们有两个项目,我们检索了item1。结果是一个有4行3列的DataFrame,它们是 Major_axis 和 Minor_axis 维度。
使用major_axis
可以使用方法 panel.major_axis(index) 访问数据 。
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.major_xs(1)
其 输出结果 如下 –
Item1 Item2
0 0.417497 0.748412
1 0.896681 -0.557322
2 0.576657 NaN
使用minor_axis
可以使用 panel.minor_axis(index) 方法访问数据 。
# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.minor_xs(1)
其 输出结果 如下 –
Item1 Item2
0 -0.128637 -1.047032
1 0.896681 -0.557322
2 0.571668 0.431953
3 -0.144234 1.302466
注意 - 观察尺寸的变化。