用Python描述一个NumPy数组
NumPy是一个用于数值计算的Python库。它提供了强大的多维数组作为Python对象,以及各种数学函数。在这篇文章中,我们将浏览所有用于数组描述性分析的基本NumPy函数。让我们先为我们的分析初始化一个样本数组。
下面的代码初始化了一个NumPy数组。
import numpy as np
# sample array
arr = np.array([4, 5, 8, 5, 6, 4,
9, 2, 4, 3, 6])
print(arr)
输出:
[4 5 8 5 6 4 9 2 4 3 6]
为了描述我们的NumPy数组,我们需要找到两种类型的统计数据。
- 中心趋势的测量
- 分散的措施
中心趋势的测量
以下方法用于在NumPy中寻找中心趋势的测量。
- mean()-接收一个NumPy数组作为参数,并返回数据的算术平均值。
np.mean(arr)
- median()–接收一个NumPy数组作为参数,并返回数据的中位数。
np.median(arr)
下面的例子说明了mean()和median()方法的用法。
示例:
import numpy as np
arr = np.array([4, 5, 8, 5, 6, 4,
9, 2, 4, 3, 6])
# measures of central tendency
mean = np.mean(arr)
median = np.median(arr)
print("Array =", arr)
print("Mean =", mean)
print("Median =", median)
输出:
Array = [4 5 8 5 6 4 9 2 4 3 6]
Mean = 5.09090909091
Median = 5.0
分散性的衡量标准
在NumPy中,以下方法被用来寻找分散度的测量。
- amin()–它接收一个NumPy数组作为参数并返回最小值。
np.amin(arr)
- amax()–它接收一个NumPy数组作为参数并返回最大值。
np.amax(arr)
- ptp()-它接收一个NumPy数组作为参数,并返回数据的范围。
np.ptp(arr)
- var()–它接收一个NumPy数组作为参数,并返回数据的方差。
np.var(arr)
- std()–它接收一个NumPy数组作为参数,并返回数据的标准差。
np.std(arr)
例子:下面的代码说明了amin()、max()、tp()、var()和std()方法。
import numpy as np
arr = np.array([4, 5, 8, 5, 6, 4,
9, 2, 4, 3, 6])
# measures of dispersion
min = np.amin(arr)
max = np.amax(arr)
range = np.ptp(arr)
variance = np.var(arr)
sd = np.std(arr)
print("Array =", arr)
print("Measures of Dispersion")
print("Minimum =", min)
print("Maximum =", max)
print("Range =", range)
print("Variance =", variance)
print("Standard Deviation =", sd)
输出:
Array = [4 5 8 5 6 4 9 2 4 3 6]
Measures of Dispersion
Minimum = 2
Maximum = 9
Range = 7
Variance = 3.90082644628
Standard Deviation = 1.9750509984
例子:现在我们可以把上述例子结合起来,得到一个完整的对我们的数组的描述性分析。
import numpy as np
arr = np.array([4, 5, 8, 5, 6, 4,
9, 2, 4, 3, 6])
# measures of central tendency
mean = np.mean(arr)
median = np.median(arr)
# measures of dispersion
min = np.amin(arr)
max = np.amax(arr)
range = np.ptp(arr)
variance = np.var(arr)
sd = np.std(arr)
print("Descriptive analysis")
print("Array =", arr)
print("Measures of Central Tendency")
print("Mean =", mean)
print("Median =", median)
print("Measures of Dispersion")
print("Minimum =", min)
print("Maximum =", max)
print("Range =", range)
print("Variance =", variance)
print("Standard Deviation =", sd)
输出:
Descriptive analysis
Array = [4 5 8 5 6 4 9 2 4 3 6]
Measurements of Central Tendency
Mean = 5.09090909091
Median = 5.0
Minimum = 2
Maximum = 9
Range = 7
Variance = 3.90082644628
Standard Deviation = 1.9750509984