Numpy np.random.choice: 概率不和为1

在使用Numpy的np.random.choice函数时，我们经常需要指定一个概率分布来从中抽取样本。在这个过程中，我们需要注意概率是否和为1，否则有可能导致错误的结果。

阅读更多：Numpy 教程

问题描述

考虑以下代码：

import numpy as np

a = [1, 2, 3, 4]
p = [0.1, 0.2, 0.3]

np.random.choice(a, p=p)

根据np.random.choice的文档，p参数是一个表示归一化的概率分布的列表。也就是说，p中的元素应该满足以下条件：

$\sum_{i=1}^{n} p_i = 1$

在上面的代码中，p中只有3个元素，而不是4个。因此，我们需要将其它元素的概率设为0，以满足上述条件：

import numpy as np

a = [1, 2, 3, 4]
p = [0.1, 0.2, 0.3, 0.4]

np.random.choice(a, p=p)

这样的结果才是正确的。

问题解决

当我们需要从一个具有 $n$ 个元素的列表 $a$ 中抽取 $k$ 个元素时，可以使用以下代码：

import numpy as np

a = [1, 2, 3, 4, 5]
k = 3

np.random.choice(a, k)

这个代码会返回列表 $a$ 中随机的 $k$ 个元素，其中每个元素被抽中的概率相等，即 $1/n$ 。如果我们需要每个元素被抽中的概率不同，可以使用 $p$ 参数来指定一个概率分布。

在指定 $p$ 参数时，需要保证 $p$ 中的元素满足以下条件：

$\sum_{i=1}^{n} p_i = 1$

由于 $p$ 中的元素表示的是概率，因此我们需要保证 $p_i \ge 0$ ，同时也可以将 $p$ 中的元素进行缩放，以满足以上条件。例如，假设我们希望从列表 ${1,2,3,4}$ 中随机抽取2个元素，其中元素1和元素2的概率是0.2和0.3，那么可以这样指定 $p$ 参数：

import numpy as np

a = [1, 2, 3, 4]
p = np.array([0.2, 0.3, 0, 0.5])

np.random.choice(a, 2, p=p)

在此示例中，我们将 $p$ 中第3和第4个元素的概率设置为0，因为我们不希望从中抽取元素。然后，我们对 $p$ 进行了归一化，使得 $p$ 中的元素之和为1。

应用实例

在实际应用中，我们可能需要从多个分布中进行抽样，并将这些抽样结果合并为一个结果。例如，假设我们有一个长度为100的数组，其中前20个元素来自 $N(0,1)$ 分布，后80个元素来自 $N(5,1)$ 分布，我们想要从这个数组中随机抽取20个元素，可以这样实现：

import numpy as np

a = np.concatenate([np.random.normal(0, 1, 20), np.random.normal(5, 1, 80)])
p = np.zeros(100)
p[:20] = 0.2
p[20:] = 0.8/80

np.random.choice(a, 20, p=p)

注意，我们在 $p$ 中将前20个元素的概率设为了0.2，将后80个元素的概率设为了 $0.8/80$ ，这样即可保证 $p$ 中的元素之和为1。

总结

在使用Numpy的np.random.choice函数中，需要注意概率是否和为1。我们可以使用归一化的概率分布来指定 $p$ 参数，并将其它元素的概率设为0，以满足条件。在实际应用中，我们可以将多个分布进行合并，并使用合适的概率分布来抽取样本。

Numpy np.random.choice: 概率不和为1

Numpy np.random.choice: 概率不和为1

问题描述

问题解决

应用实例

总结

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

NumPy 精品教程

回顶部