矩阵

矩阵在线性代数中起着中心作用。它们可以用来简洁地表示线性方程组,但是它们也可以表示线性函数(线性映射)。在讨论这些有趣的主题之前,让我们先定义什么是矩阵以及我们可以用矩阵做什么运算。我们将在后续文章中看到矩阵的更多性质。

矩阵(Matrix):对于m, n∈n,一个实值(m, n)矩阵A为元素a_{ij}m·n元组,i = 1,…, m, j = 1,…, n,它按照由m行和n列组成的矩形格式排序:
A=
\begin{bmatrix}
a_{11}&…&a_{1n} \\
a_{21}& &a_{2n} \\
.& &. \\
.& &. \\
a_{m1}&…& a_{mn}
\end{bmatrix}, a_{ij}∈ R

按照惯例(1,n)-矩阵称为矩阵行,(m, 1)-矩阵称为矩阵列。这些特殊的矩阵也称为行/列向量。

R^{m×n} 是所有实值(m, n)矩阵的集合。A∈R^{m×n}可以等价地表示为a∈R^{mn},方法是将矩阵的所有n列叠加成一个长向量;见图1:
通过叠加列向量,矩阵A可以表示为一个长向量a:
矩阵
图1

矩阵加法与乘法

两个矩阵A∈R^{m×n},B∈R^{m×n}的和定义为元素和,即:
A+B:=
\begin{bmatrix}
a_{11}+b_{11}&…&a_{1n}+b_{1n} \\
.&&. \\
.&&. \\
.&&. \\
a_{m1}+b{m1}&…& a_{mn}+b_{mn}
\end{bmatrix}∈R^{m×n}

对于矩阵A∈R^{m×n}B∈R^{n×k},C=AB∈R^{m×k}的元素c_{ij}被计算为:
c_{ij}=\sum_{l=1}^Na_{il}b_{lj},i=1,…m;j=1,…,k。
那就是说,为了计算c_{ij},我们把A的第i行和B的第j列的元素相乘,然后求和。我们称它为对应行和列的点积。在在某些情况下,我们需要显式地证明我们在做乘法,我们使用符号A·B表示乘法(显式显示“·”)。
注意,矩阵只有在其“相邻”维数下才能相乘匹配。例如,一个n×k矩阵A可以与一个k×m矩阵B相乘,但只能从左边:
矩阵
如果m \not= n,乘积BA没有定义,因为相邻维数不匹配。

注意,矩阵乘法不定义为对矩阵元素的元素操作,即, c_{ij} \not= a_{ij}b_{ij}(即使 A、B 的大小被适当选择)。

例1:
矩阵
从这个例子中,我们已经看到矩阵乘法是不可交换的。
例如:AB \not= BA

单位矩阵:在R^{n×n}里,我们把单位矩阵定义为n×n矩阵,对角线上包含1,其它地方都为0。
矩阵

现在我们定义了矩阵乘法,矩阵加法和单位矩阵,让我们看看矩阵的一些性质:
结合律:
∀A ∈ R^{m×n}, B ∈ R^{n×p}, C ∈ R^{p×q}: (AB)C = A(BC)

分配律:
∀A, B ∈ R^{m×n}, C, D ∈ R^{n×p}:
(A + B)C = AC + BC,A(C + D) = AC + AD

与单位矩阵相乘:
∀A ∈ R^{m×n}: I_m A = AI_n = A
注意: I_m \not= I_n ,m \not= n

逆和转置

逆(Inverse):假设一个方阵A∈R^{n×n},令矩阵B∈R^{n×n}具有AB = I_n = BA的性质,则B称为A的逆,用A^{-1}表示。

不幸的是,并不是每个矩阵A都有一个逆矩阵A^{-1}。如果这个逆确实存在,那么A叫做正则的/可逆的/非奇异的,否则就是奇异的/非可逆的。当矩阵逆存在时,它是唯一的。在下一节中,我们将讨论通过解线性方程组来计算矩阵逆的一般方法。
让我们来看矩阵
A:=
\begin{bmatrix}
a_{11}&a_{12} \\
a_{21}&a_{22}
\end{bmatrix}∈R^{2×2}
,B:=
\begin{bmatrix}
a_{22}&-a_{12} \\
-a_{21}&a_{11}
\end{bmatrix}

让A与B相乘得到:
AB:=
\begin{bmatrix}
a_{11}a_{22}-a_{12}a_{21}&0 \\
0&a_{11}a_{22}-a_{12}a_{21}
\end{bmatrix} = (a_{11}a_{22} − a_{12}a_{21})I
。因此:
A^{-1} =\frac{1}{a_{11}a_{22} − a_{12}a_{21}}
\begin{bmatrix}
a_{22}&-a_{12} \\
-a_{21}&a_{11}
\end{bmatrix}

当且仅当a_{11}a_{22}−a_{12}a_{21} \not = 0。在后续文章中,我们将看到a_{11}a_{22}−a_{12}a_{21}是一个2×2矩阵的行列式。此外,我们通常可以用行列式检查矩阵是否可逆。
例如:
由于AB = I = BA,这两个矩阵互为逆:
A=
\begin{bmatrix}
1&2&1 \\
4&4&5 \\
6&7&7
\end{bmatrix}
,B=
\begin{bmatrix}
-7&-7&6 \\
2&1&-1 \\
4&5&-4
\end{bmatrix}

转置(Transpose):对于矩阵A ∈ R^{m×n}来说,如果有矩阵 B ∈ R^{n×m}b_{ij}=a_{ji},那么B叫做A的转置,记作B = A^T
一般来说,A^T可以通过将A的列作为行来得到A^T。下面是逆变换的重要性质:
AA^{−1} = I = A^{−1}A \\
(AB)^{−1} = B^{−1}A^{−1} \\
(A + B)^{−1}\not= A^{−1} + B^{−1} \\
(A^T)^T = A \\
(A + B)^T = A^T + B^T \\
(AB)^T = B^TA^T

对称矩阵,如果A = A^T,那么矩阵A ∈ R^{n×n}是对称的。
注意,只有(n, n)-矩阵是对称的。通常,我们称(n, n)矩阵为方阵,因为它们具有相同的行数和列数。而且,如果A是可逆的,那么A^T也是可逆的,且
(A^{-1})^T =(A^T)^{-1}:=A^{-T}
注(对称矩阵的和与积)。对称矩阵A, B∈R^{n×n}的和总是对称的。然而,尽管他们的乘积总是被定义的,但是它通常不是对称的:
\begin{bmatrix}
1&0 \\
0&0
\end{bmatrix}
\begin{bmatrix}
1&1 \\
1&1
\end{bmatrix}=\begin{bmatrix}
1&1 \\
0&0
\end{bmatrix}

标量乘法

让我们看看当矩阵与一个标量λ ∈ R相乘会发生什么。设置A ∈ R^{m×n} and λ ∈ R,则λA = K, K_{ij} = λa_{ij}。实际上,λ 缩放矩阵A的每个元素,对于λ, ψ ∈ R,以下成立:
结合律:
(λψ)C = λ(ψC), C ∈ R^{m×n}
λ(BC) = (λB)C = B(λC) = (BC)λ, B ∈ R^{m×n}, C ∈ R^{n×k}
注意,这里允许我们移动标量值。
(λC)^T=C^Tλ^T=C^Tλ=λC^T,因为λ = λ^T,λ ∈ R.

分配律:
(λ + ψ)C = λC + ψC, C ∈ R^{m×n} \\
λ(B + C) = λB + λC, B, C ∈ R^{m×n}

例如,分配律:
如果我们定义C:=\begin{bmatrix}
1&2 \\
3&4
\end{bmatrix}
,对于任何λ, ψ ∈ R,我们可以得到:
矩阵

线性方程组的紧凑表示

如果我们考虑线性方程组:
2x_1 + 3x_2 + 5x_3 = 1 \\
4x_1 − 2x_2 − 7x_3 = 8 \\
9x_1 + 5x_2 − 3x_3 = 2

利用矩阵乘法的规则,我们可以写出这个方程以更紧凑的形式为:
\begin{bmatrix}
2&3&5 \\
4&-2&-7 \\
9&5&-3
\end{bmatrix}\begin{bmatrix}
x_1 \\
x_2 \\
x_3
\end{bmatrix} = \begin{bmatrix}
1 \\
8 \\
2
\end{bmatrix}

注意x_1缩放第一列,x_2缩放第二列,x_3缩放第三列。
一般情况下,一个线性方程组可以用其矩阵形式简洁地表示为Ax = b

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程