Python Pandas Dataframe.describe()方法

Python Pandas Dataframe.describe()方法

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

Pandas describe()用于查看一些基本的统计细节,如数据框或一系列数值的百分位数、平均值、标准差等。当这个方法应用于一系列字符串时,它会返回一个不同的输出,如下例所示。

语法: DataFrame.describe(percentiles=None, include=None, exclude=None)

参数:
percentiles:类似列表的0-1之间的数字的数据类型,返回各自的百分位数。
include:描述数据框架时要包括的数据类型列表。默认为无
exclude:描述数据框架时要排除的数据类型列表。默认为无

返回类型。数据框架的统计摘要。
在下面的例子中,所使用的数据框包含一些NBA球员的数据。下面是数据框在任何操作之前的图像。
Python Pandas Dataframe.describe()方法

例子#1:用对象和数字数据类型来描述数据框架

在这个例子中,数据框架被描述,[‘object’]被传递给include参数,以查看对象系列的描述。[.20, .40, .60, .80]被传递给percentile参数,以查看数字系列的各自百分位数。

# importing pandas module 
import pandas as pd 
  
# importing regex module
import re
    
# making data frame 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
    
# removing null values to avoid errors 
data.dropna(inplace = True) 
  
# percentile list
perc =[.20, .40, .60, .80]
  
# list of dtypes to include
include =['object', 'float', 'int']
  
# calling describe method
desc = data.describe(percentiles = perc, include = include)
  
# display
desc
Python

输出:
如输出图片所示,数据框架的统计描述与各自传递的百分位数一起返回。对于带有字符串的列,数字操作会返回NaN。
Python Pandas Dataframe.describe()方法

例子#2:描述系列字符串

在这个例子中,describe方法是由Name列调用的,以查看对象数据类型的行为。

# importing pandas module 
import pandas as pd 
  
# importing regex module
import re
    
# making data frame 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
    
# removing null values to avoid errors 
data.dropna(inplace = True) 
  
# calling describe method
desc = data["Name"].describe()
  
# display
desc
Python

输出:
如输出图片所示,describe()的行为在一系列字符串中是不同的。
在这种情况下,会返回不同的统计信息,如值的数量、唯一的值、顶部和出现的频率。
Python Pandas Dataframe.describe()方法

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册