矩阵在线性代数中起着中心作用。它们可以用来简洁地表示线性方程组,但是它们也可以表示线性函数(线性映射)。在讨论这些有趣的主题之前,让我们先定义什么是矩阵以及我们可以用矩阵做什么运算。我们将在后续文章中看到矩阵的更多性质。
矩阵(Matrix):对于m, n∈n,一个实值(m, n)矩阵A为元素aij的m⋅n元组,i=1,…,m,j=1,…,n,它按照由m行和n列组成的矩形格式排序:
A=⎣⎡a11a21..am1……a1na2n..amn⎦⎤,aij∈R
按照惯例(1,n)-矩阵称为矩阵行,(m, 1)-矩阵称为矩阵列。这些特殊的矩阵也称为行/列向量。
Rm×n 是所有实值(m, n)矩阵的集合。A∈Rm×n可以等价地表示为a∈Rmn,方法是将矩阵的所有n列叠加成一个长向量;见图1:
通过叠加列向量,矩阵A可以表示为一个长向量a:

图1
矩阵加法与乘法
两个矩阵A∈Rm×n,B∈Rm×n的和定义为元素和,即:
A+B:=⎣⎡a11+b11...am1+bm1……a1n+b1n...amn+bmn⎦⎤∈Rm×n
对于矩阵A∈Rm×n和B∈Rn×k,C=AB∈Rm×k的元素cij被计算为:
cij=l=1∑Nailblj,i=1,…m;j=1,…,k。
那就是说,为了计算cij,我们把A的第i行和B的第j列的元素相乘,然后求和。我们称它为对应行和列的点积。在在某些情况下,我们需要显式地证明我们在做乘法,我们使用符号A·B表示乘法(显式显示“·”)。
注意,矩阵只有在其“相邻”维数下才能相乘匹配。例如,一个n×k矩阵A可以与一个k×m矩阵B相乘,但只能从左边:

如果m=n,乘积BA没有定义,因为相邻维数不匹配。
注意,矩阵乘法不定义为对矩阵元素的元素操作,即, cij=aijbij(即使 A、B 的大小被适当选择)。
例1:

从这个例子中,我们已经看到矩阵乘法是不可交换的。
例如:AB=BA。
单位矩阵:在Rn×n里,我们把单位矩阵定义为n×n矩阵,对角线上包含1,其它地方都为0。

现在我们定义了矩阵乘法,矩阵加法和单位矩阵,让我们看看矩阵的一些性质:
结合律:
∀A∈Rm×n,B∈Rn×p,C∈Rp×q:(AB)C=A(BC)
分配律:
∀A,B∈Rm×n,C,D∈Rn×p:(A+B)C=AC+BC,A(C+D)=AC+AD
与单位矩阵相乘:
∀A∈Rm×n:ImA=AIn=A
注意: Im=In,m=n
逆和转置
逆(Inverse):假设一个方阵A∈Rn×n,令矩阵B∈Rn×n具有AB=In=BA的性质,则B称为A的逆,用A−1表示。
不幸的是,并不是每个矩阵A都有一个逆矩阵A−1。如果这个逆确实存在,那么A叫做正则的/可逆的/非奇异的,否则就是奇异的/非可逆的。当矩阵逆存在时,它是唯一的。在下一节中,我们将讨论通过解线性方程组来计算矩阵逆的一般方法。
让我们来看矩阵
A:=[a11a21a12a22]∈R2×2,B:=[a22−a21−a12a11]
让A与B相乘得到:
AB:=[a11a22−a12a2100a11a22−a12a21]=(a11a22−a12a21)I。因此:
A−1=a11a22−a12a211[a22−a21−a12a11]
当且仅当a11a22−a12a21=0。在后续文章中,我们将看到a11a22−a12a21是一个2×2矩阵的行列式。此外,我们通常可以用行列式检查矩阵是否可逆。
例如:
由于AB = I = BA,这两个矩阵互为逆:
A=⎣⎡146247157⎦⎤,B=⎣⎡−724−7156−1−4⎦⎤
转置(Transpose):对于矩阵A∈Rm×n来说,如果有矩阵 B∈Rn×m且bij=aji,那么B叫做A的转置,记作B=AT。
一般来说,AT可以通过将A的列作为行来得到AT。下面是逆变换的重要性质:
AA−1=I=A−1A(AB)−1=B−1A−1(A+B)−1=A−1+B−1(AT)T=A(A+B)T=AT+BT(AB)T=BTAT
对称矩阵,如果A=AT,那么矩阵A∈Rn×n是对称的。
注意,只有(n, n)-矩阵是对称的。通常,我们称(n, n)矩阵为方阵,因为它们具有相同的行数和列数。而且,如果A是可逆的,那么AT也是可逆的,且
(A−1)T=(AT)−1:=A−T。
注(对称矩阵的和与积)。对称矩阵A,B∈Rn×n的和总是对称的。然而,尽管他们的乘积总是被定义的,但是它通常不是对称的:
[1000][1111]=[1010]
标量乘法
让我们看看当矩阵与一个标量λ ∈ R相乘会发生什么。设置A∈Rm×n and λ ∈ R,则λA=K,Kij=λaij。实际上,λ 缩放矩阵A的每个元素,对于λ, ψ ∈ R,以下成立:
结合律:
(λψ)C=λ(ψC),C∈Rm×n
λ(BC)=(λB)C=B(λC)=(BC)λ,B∈Rm×n,C∈Rn×k
注意,这里允许我们移动标量值。
(λC)T=CTλT=CTλ=λCT,因为λ=λT,λ∈R.
分配律:
(λ+ψ)C=λC+ψC,C∈Rm×nλ(B+C)=λB+λC,B,C∈Rm×n
例如,分配律:
如果我们定义C:=[1324],对于任何λ, ψ ∈ R,我们可以得到:

线性方程组的紧凑表示
如果我们考虑线性方程组:
2x1+3x2+5x3=14x1−2x2−7x3=89x1+5x2−3x3=2
利用矩阵乘法的规则,我们可以写出这个方程以更紧凑的形式为:
⎣⎡2493−255−7−3⎦⎤⎣⎡x1x2x3⎦⎤=⎣⎡182⎦⎤
注意x1缩放第一列,x2缩放第二列,x3缩放第三列。
一般情况下,一个线性方程组可以用其矩阵形式简洁地表示为Ax=b。