如何在Python中创建稀疏矩阵?
在本文中,我们将向您展示什么是稀疏矩阵以及如何在Python中创建稀疏矩阵。
什么是稀疏矩阵?
稀疏矩阵是大多数元素 0 的矩阵。也就是说,矩阵仅在少数位置包含数据。稀疏矩阵消耗的大部分内存由零组成。
例如 –
M = [
[1, 0, 0, 0],
[0, 0, 3, 0],
[0, 0, 0, 0],
[0, 0, 0, 2]
]
在大多数情况下,使用二维数组代表稀疏矩阵会浪费大量的内存,因为矩阵中的零在大多数情况下是无用的。因此,我们只存储非零元素,而不是将零与非零元素一起保存。这涉及使用三元组来存储非零元素(行、列、值)。
自然语言处理(NLP)和数据编码都广泛使用稀疏矩阵。如果矩阵的大部分元素都是0,则在存储方面存储所有矩阵元素变得非常昂贵。
这是因为我们只有少数数据点,大多数存储空间被冗余的零占据。
稀疏矩阵的优势
与简单矩阵相比,使用稀疏矩阵的两个主要优点如下:
-
存储 – 因为非零元素比零元素少,所以可以使用更少的内存仅存储这些元素。
-
计算时间 – 可以通过逻辑上创建一个仅遍历非零元素的数据结构来节省计算时间。
如何在Python中创建稀疏矩阵?
Python中,SciPy提供了使用各种数据结构创建稀疏矩阵的工具,以及将密集矩阵转换为稀疏矩阵的工具。
我们可以使用以下函数在Python中创建稀疏矩阵:
-
csr_matrix()函数 – 在压缩中创建稀疏矩阵 行 格式,
-
csc_matrix()函数 – 在压缩中创建稀疏矩阵 列 格式,
方法1.使用csr_matrix()函数创建稀疏矩阵
它在压缩中创建一个稀疏矩阵 行 格式。
语法
scipy.sparse.csr_matrix(shape=None, dtype=None)
参数
-
形状 -它是矩阵的形状
-
dtype – 它是矩阵的数据类型
算法(步骤)
要执行所需任务,必须遵循以下算法/步骤 −
-
使用import关键字导入numpy模块,并为其设置别名np。
-
使用import关键字从scipy模块导入csr_matrix函数。
-
使用csr_matrix()函数创建一个3 * 3稀疏矩阵(行格式)的int型,并使用toarray()函数将其转换为数组。
-
打印结果稀疏矩阵。
示例
以下程序使用csr_matrix()函数返回稀疏矩阵(3×3)-
# 使用别名导入numpy模块
import numpy as np
# 从scipy模块中导入csr_matrix函数
from scipy.sparse import csr_matrix
# 使用csr_matrix函数创建一个3 * 3的稀疏矩阵,类型为int,并将其转换为数组
稀疏矩阵 = csr_matrix((3, 3), dtype = np.int8).toarray()
# 打印结果的稀疏矩阵
print("The resultant sparse matrix:\n", 稀疏矩阵)
输出结果
运行上述程序将生成以下输出−
The resultant sparse matrix:
[[0 0 0]
[0 0 0]
[0 0 0]]
方法2. 使用给定Numpy Array的csr_matrix()函数创建稀疏矩阵
算法(步骤)
执行所需任务的算法/步骤如下:
-
使用import关键字导入 numpy 模块,并将其别名为(np)。
-
使用import关键字导入scipy模块中的 csr_matrix 函数。
-
使用numpy.array()函数创建数组(ndarray)。
示例
# 使用别名导入numpy模块
import numpy as np
# 从scipy模块中导入csr_matrix函数
from scipy.sparse import csr_matrix
# 声明行和列的值
行 = np.array([0, 1, 0, 2, 1, 1])
列 = np.array([1, 0, 0, 2, 1, 2])
# 声明数组数据
数组数据 = np.array([1, 3, 2, 5, 7, 6])
# 使用csr_matrix函数创建一个3x3的稀疏矩阵
稀疏矩阵 = csr_matrix((数组数据, (行,列)),
shape = (3, 3)).toarray()
# 打印结果的稀疏矩阵
print("The resultant sparse matrix:\n", 稀疏矩阵)
输出结果
运行上述程序将生成以下输出−
The resultant sparse matrix:
[[2 1 0]
[3 7 6]
[0 0 5]]
方法3. 使用csc_matrix()函数创建稀疏矩阵
它创建以压缩稀疏列格式表示的稀疏矩阵。
语法
scipy.sparse.csc_matrix(shape=None, dtype=None)
参数
-
形状 – 它是矩阵的形状
-
dtype – 它是矩阵的数据类型
算法
下面是执行所需任务的算法/步骤 –
-
使用import关键字,导入numpy模块并使用别名np。
-
使用import关键字,从scipy模块导入csc_matrix函数。
-
使用csc_matrix()函数创建一个3 X 3的稀疏矩阵(列格式)以int数据类型为, 并使用toarray()函数将其转换为数组。
-
打印结果的稀疏矩阵。
示例
以下程序使用csc_matrix()函数返回列格式的稀疏矩阵(3×3) –
#使用别名np导入numpy模块
import numpy as np
# 从scipy模块导入csc_matrix函数
from scipy.sparse import csc_matrix
#使用csc_matrix函数创建一个3 X 3的稀疏矩阵以int数据类型为, 并将其转换为数组
sparse_matrix = csc_matrix((3, 3), dtype = np.int8).toarray()
#打印结果的稀疏矩阵
print("结果的稀疏矩阵:\n", sparse_matrix)
输出
执行以上程序将生成以下输出 –
结果的稀疏矩阵:
[[0 0 0]
[0 0 0]
[0 0 0]]
方法4.使用给定Numpy数组的csc_matrix()函数创建稀疏矩阵
示例
以下程序使用csc_matrix()函数以整数列格式返回稀疏矩阵(3×3) –
import numpy as np
#从scipy模块导入csc_matrix函数
from scipy.sparse import csc_matrix
#给出行和列的值
rows = np.array([0, 1, 0, 2, 1, 1])
columns = np.array([1, 0, 0, 2, 1, 2])
#给出数组数据
arrayData = np.array([1, 3, 2, 5, 7, 6])
#使用csc_matrix函数以列格式创建一个3x3的稀疏矩阵
sparse_matrix = csc_matrix((arrayData, (rows, columns)),
shape = (3, 3)).toarray()
#打印结果的稀疏矩阵
print("结果的稀疏矩阵:\n", sparse_matrix)
输出
在执行时,上述程序将生成以下输出进行−
结果稀疏矩阵:
[[2 1 0]
[3 7 6]
[0 0 5]]
结论
在本教程中,我们学习了在Python中生成稀疏矩阵的四种不同方法。我们还学习了如何从numpy数组生成稀疏矩阵。