用Python描述一个NumPy数组

用Python描述一个NumPy数组

NumPy是一个用于数值计算的Python库。它提供了强大的多维数组作为Python对象,以及各种数学函数。在这篇文章中,我们将浏览所有用于数组描述性分析的基本NumPy函数。让我们先为我们的分析初始化一个样本数组。

下面的代码初始化了一个NumPy数组。

import numpy as np
 
 
# sample array
arr = np.array([4, 5, 8, 5, 6, 4,
                9, 2, 4, 3, 6])
print(arr)

输出:

[4 5 8 5 6 4 9 2 4 3 6]

为了描述我们的NumPy数组,我们需要找到两种类型的统计数据。

  • 中心趋势的测量
  • 分散的措施

中心趋势的测量

以下方法用于在NumPy中寻找中心趋势的测量。

  • mean()-接收一个NumPy数组作为参数,并返回数据的算术平均值。
np.mean(arr)
  • median()–接收一个NumPy数组作为参数,并返回数据的中位数。
 np.median(arr)

下面的例子说明了mean()和median()方法的用法。

示例:

import numpy as np
 
 
arr = np.array([4, 5, 8, 5, 6, 4,
                9, 2, 4, 3, 6])   
 
# measures of central tendency
mean = np.mean(arr)
median = np.median(arr)
 
print("Array =", arr)
print("Mean =", mean)
print("Median =", median)

输出:

Array = [4 5 8 5 6 4 9 2 4 3 6]
Mean = 5.09090909091
Median = 5.0

分散性的衡量标准

在NumPy中,以下方法被用来寻找分散度的测量。

  • amin()–它接收一个NumPy数组作为参数并返回最小值。
np.amin(arr)
  • amax()–它接收一个NumPy数组作为参数并返回最大值。
np.amax(arr)
  • ptp()-它接收一个NumPy数组作为参数,并返回数据的范围。
np.ptp(arr)
  • var()–它接收一个NumPy数组作为参数,并返回数据的方差。
np.var(arr)
  • std()–它接收一个NumPy数组作为参数,并返回数据的标准差。
np.std(arr)

例子:下面的代码说明了amin()、max()、tp()、var()和std()方法。

import numpy as np
 
 
arr = np.array([4, 5, 8, 5, 6, 4,
                9, 2, 4, 3, 6])
 
# measures of dispersion
min = np.amin(arr)
max = np.amax(arr)
range = np.ptp(arr)
variance = np.var(arr)
sd = np.std(arr)
 
print("Array =", arr)
print("Measures of Dispersion")
print("Minimum =", min)
print("Maximum =", max)
print("Range =", range)
print("Variance =", variance)
print("Standard Deviation =", sd)

输出:

Array = [4 5 8 5 6 4 9 2 4 3 6]
Measures of Dispersion
Minimum = 2
Maximum = 9
Range = 7
Variance = 3.90082644628
Standard Deviation = 1.9750509984

例子:现在我们可以把上述例子结合起来,得到一个完整的对我们的数组的描述性分析。

import numpy as np 
 
 
arr = np.array([4, 5, 8, 5, 6, 4,
                9, 2, 4, 3, 6])   
 
# measures of central tendency
mean = np.mean(arr)
median = np.median(arr)
 
# measures of dispersion
min = np.amin(arr)
max = np.amax(arr)
range = np.ptp(arr)
variance = np.var(arr)
sd = np.std(arr)
 
print("Descriptive analysis")
print("Array =", arr)
print("Measures of Central Tendency")
print("Mean =", mean)
print("Median =", median)
print("Measures of Dispersion")
print("Minimum =", min)
print("Maximum =", max)
print("Range =", range)
print("Variance =", variance)
print("Standard Deviation =", sd)

输出:

Descriptive analysis
Array = [4 5 8 5 6 4 9 2 4 3 6]
Measurements of Central Tendency
Mean = 5.09090909091
Median = 5.0
Minimum = 2
Maximum = 9
Range = 7
Variance = 3.90082644628
Standard Deviation = 1.9750509984

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程