Pandas Python 中数据如何进行汇总?
可以通过使用不同的函数来获取有关数据的大量信息。但是,如果我们希望获取有关数据的所有信息,则可以使用“describe”函数。
该函数将提供有关“计数”、“平均值”、“标准偏差”、“第25个百分位数”、“第50个百分位数”和第75个百分位数的信息。
更多Pandas文章,请阅读:Pandas教程
示例
import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("数据框是:")
my_df = pd.DataFrame(my_data)
print(my_df)
print("数据的描述信息是:")
print(my_df.describe())
输出
数据框是:
Name Age value
0 Tom 45 8.79
1 Jane 67 23.24
2 Vin 89 31.98
3 Eve 12 78.56
4 Will 23 90.20
数据的描述信息是:
Age value
count 5.000000 5.000000
mean 47.200000 46.554000
std 31.499206 35.747102
min 12.000000 8.790000
25% 23.000000 23.240000
50% 45.000000 31.980000
75% 67.000000 78.560000
max 89.000000 90.200000
说明
- 导入了所需的库,并给它们起了别名以便于使用。
- 创建一个系列字典,其中键和值是系列数据结构。
- 稍后将此字典作为参数传递给“ pandas”库中存在的“ Dataframe”函数
- 在控制台上打印数据框。
- 我们正在查看有关数据的所有信息。
- 在数据框上调用“ describe”函数。
- 在控制台上打印描述信息。