Python Pandas dataframe.info()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,使导入和分析数据变得更加容易。
Pandas dataframe.info()函数是用来获取数据框架的简明摘要。在对数据进行探索性分析时,它真的很方便。为了获得数据集的快速概述,我们使用dataframe.info()函数。
语法: DataFrame.info(verbose=None, buf=None, max_cols=None, memory_usage=None, null_counts=None)
参数 :
verbose : 是否打印完整的摘要。无跟随display.max_info_columns的设置。True或False会覆盖display.max_info_columns的设置。
buf :可写缓冲区,默认为sys.stdout。
max_cols :决定是否打印完整摘要或简短摘要。无跟随display.max_info_columns的设置。
memory_usage :指定是否要显示DataFrame元素(包括索引)的总内存用量。None跟随display.memory_usage的设置。True或False覆盖了display.memory_usage的设置。值为’deep’相当于True,有深度反省。内存使用量以人类可读的单位显示(base-2表示)。
null_counts : 是否显示非空值的计数。如果无,那么只在框架小于max_info_rows和max_info_columns时显示。如果是True,总是显示计数。如果是False,则永远不显示计数。
示例#1:使用info()函数来打印数据帧的完整摘要。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the dataframe
df

让我们打印数据帧的完整摘要。
# to print the full summary
df.info()
输出 :

正如我们在输出中看到的,摘要包括所有列的列表,以及它们的数据类型和每一列中非空值的数量。
示例#2:使用info()函数打印数据帧的简短摘要。
注意:为了打印简短的摘要,我们可以使用verbose参数并将其设置为False。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the short summary of the
# dataframe by setting verbose = False
df.info(verbose = False)
输出 :

正如我们在输出中所看到的,摘要是非常清晰和简短的。当我们在数据框架中有1000个属性时,这很有帮助。
示例#3:使用info()函数打印数据帧的完整摘要,并排除空计数。
注意:为了打印完整的摘要,不包括空数,我们可以使用null-counts参数并将其设置为false。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the full summary of the dataframe
# with null count excluded
df.info(verbose = True, null_counts = False)
输出 :

正如我们在输出中所看到的,摘要是完整的,但空数被排除在外。
极客教程