正定矩阵

在线性代数里,正定矩阵是埃尔米特矩阵的一种,有时会简称为正定阵。在线性代数中,正定矩阵的性质类似复数中的正实数。与正定矩阵相对应的线性算子是对称正定双线性形式(复域中则对应埃尔米特正定双线性形式)。

正定矩阵的定义

一个n×nn×n的实对称矩阵MM是正定的,当且仅当对于所有的非零实系数向量zz,都有zTMz>0z^TMz > 0。其中zTz^T表示z的转置。

对于复数的情况,定义则为:一个n×nn×n的埃尔米特矩阵(或厄米矩阵)MM是正定的当且仅当对于每个非零的复向量zz,都有zMz>0z^*Mz > 0。其中zz^*表示zz的共轭转置。由于MM是埃尔米特矩阵,经计算可知,对于任意的复向量zzzMzz^*Mz必然是实数,从而可以与0比较大小。因此这个定义是自洽的。

如何判别正定矩阵

n×nn×n的埃尔米特矩阵MM,下列性质与“MM为正定矩阵”等价:

  1. 矩阵MM的所有的特征值λi\lambda_i都是正的。根据谱定理,MM必然与一个实对角矩阵D相似(也就是说M=P1DPM = P^{-1}DP ,其中PP是幺正矩阵,或者说MM在某个正交基可以表示为一个实对角矩阵)。因此,MM是正定阵当且仅当相应的D的对角线上元素都是正的。
  2. 半双线性形式
    x,y=xMy\langle \textbf{x},\textbf{y}\rangle = \textbf{x}^{*} M \textbf{y}
    定义了一个CnC^n上的内积。实际上,所有CnC^n上的内积都可看做由某个正定阵通过此种方式得到。

  3. $$M$$是n个线性无关的k维向量$$x_1,\ldots,x_n \in \mathbb{C}^k$$的Gram矩阵,其中的k为某个正整数。更精确地说,$$M$$定义为:
    $$M_{ij} = \langle \textbf{x}_i, \textbf{x}_j\rangle = \textbf{x}_i^{*} \textbf{x}_j$$.
    换句话说,$$M$$具有$$A^*A$$的形式,其中A不一定是方阵,但需要是单射的。

  4. $$M$$的所有顺序主子式,也就是顺序主子阵的行列式都是正的(西尔维斯特准则)。明确来说,就是考察下列矩阵的行列式:
    $$M$$左上角1×1的矩阵
    $$M$$左上角2×2矩阵

    $$M$$自身。
    对于半正定矩阵来说,相应的条件应改为所有的主子式非负。顺序主子式非负并不能推出矩阵是半正定的。比如以下例子:

$$ \begin{bmatrix}
1 & 1 & 1 \\
1 & 1 & 1 \\
1 & 1 & 0
\end{bmatrix} $$
5. 存在唯一的下三角矩阵$$L$$,其主对角线上的元素全是正的,使得:
$$M=L L^*$$.
其中$$L^*$$是$$L$$的共轭转置。 T这一分解被称为Cholesky分解。

对于实对称矩阵,只需将上述性质中的Cn\mathbb{C}^n改为Rn\mathbb {R} ^{n},将“共轭转置”改为“转置”就可以了。

二次型

由以上的第二个等价条件,可以得到二次型形式下正定矩阵的等价条件:用K\mathbb {K} 代表C\mathbb {C}R\mathbb {R} ,设V\mathbb{V}K\mathbb {K} 上的一个向量空间。一个埃尔米特型:

B:V×VKB : V \times V \rightarrow K
是一个双线性映射,使得B(x, y)总是B(y, x)的共轭。这样的一个映射B是正定的当且仅当对V\mathbb{V}中所有的非零向量x,都有B(x, x) > 0。

负定、半定及不定矩阵

与正定矩阵相对应的,一个n×n的埃尔米特矩阵MM是负定矩阵(英语:negative definite matrix)当且仅当对所有不为零的zRn{\displaystyle z\in \mathbb {R} ^{n}}(或zCn{\displaystyle z\in \mathbb {C} ^{n}}),都有:

zMz<0{\displaystyle z^{*}Mz<0\,}
MM是半正定矩阵(英语:positive semi-definite matrix)当且仅当对所有不为零的zRn{\displaystyle z\in \mathbb {R} ^{n}}(或zCn{\displaystyle z\in \mathbb {C} ^{n}}),都有:

zMz0{\displaystyle z^{*}Mz\geq 0}
MM是半负定矩阵(英语:negative semi-definite matrix)当且仅当对所有不为零的zRn{\displaystyle z\in \mathbb {R} ^{n}}(或zCn{\displaystyle z\in \mathbb {C} ^{n}}),都有:

zMz0{\displaystyle z^{*}Mz\leq 0}
如果一个埃尔米特矩阵既不是半正定也不是半负定的,那么称其为不定矩阵(英语:indefinite matrix)。

可以看出,上一节中正定阵的等价性质1只需略作相应改动,就可以变为判别负定矩阵、半正定矩阵和半负定矩阵的准则。注意当M是半正定时,相应的Gram矩阵不必由线性无关的向量组成。对任意矩阵AAAAA^*A必然是半正定的,并有rank(A)=rankAArank(A) = rank(A^*A,两者的秩相等)。反过来,任意的半正定矩阵都可以写作M = A*A,这就是Cholesky分解。

一个埃尔米特矩阵M是负定矩阵当且仅当M的所有奇数阶顺序主子式小于0,所有偶数阶顺序主子式大于0。当M是负定矩阵时,M的逆矩阵也是负定的。

正定矩阵的性质

MM为半正定阵,可以写作M0M \geq 0 。如果MM是正定阵,可以写作M>0M > 0。这个记法来自泛函分析,其中的正定阵定义了正算子。

对于一般的埃尔米特矩阵,MMNNMNM\geq N 当且仅当MN0M-N \geq 0 。这样可以定义一个在埃尔米特矩阵集合上的偏序关系。类似地,可以定义M>NM>N

  1. 每个正定阵都是可逆的,它的逆也是正定阵。如果MN>0M \geq N > 0 那么N1M1>0N^{-1} \geq M^{-1} > 0
  2. 如果MM是正定阵,r>0r > 0为正实数,那么rMr M也是正定阵。
    如果MMNN是正定阵,那么和M+NM + N、乘积MNMMNMNMNNMN都是正定的。如果MN=NMM N = N M,那么MNM N仍是正定阵。

  3. 如果M=(mij)>0M=(m_{ij}) > 0 那么主对角线上的系数miim_{ii} 为正实数。于是有tr(M)>0\text{tr}(M)>0 。此外还有
    mijmiimjjmii+mjj2| m_{ij} | \leq \sqrt{m_{ii} m_{jj}} \leq \frac{m_{ii}+m_{jj}}{2}.

  4. 矩阵MM是正定阵当且仅当存在唯一的正定阵B>0B>0 使得B2=MB^2 = M 。根据其唯一性可以记作B=M1/2B = M^{1/2} ,称BBMM的平方根。对半正定阵也有类似结论。同时,如果M>N>0M > N > 0 那么M1/2>N1/2>0M^{1/2} > N^{1/2}>0.
  5. 如果M,N>0M,N > 0 那么MN>0M\otimes N > 0 ,其中\otimes表示克罗内克乘积。
  6. 对矩阵M=(mij),N=(nij)M=(m_{ij}),N=(n_{ij}) ,将两者同一位置上的系数相乘所得的矩阵记为MNM\circ N,即MNi,j=mijnijM\circ N_{i,j}=m_{ij} n_{ij} ,称为MMNN的阿达马乘积。如果M,N>0M,N>0 ,那么MN>0M\circ N > 0。如果M,NM,N 为实系数矩阵,则有如下不等式成立:
    det(MN)(detN)imii\det(M\circ N) \geq (\det N) \prod_{i} m_{ii}.

  7. M>0M > 0NN为埃尔米特矩阵。如果
    MN+NM0MN+NM \geq 0MN+NM>0MN+NM > 0 ),那么N0N\geq 0N>0N > 0)。

  8. 如果M,N0M,N\geq 0为实系数矩阵,则tr(MN)0\text{tr}(MN)\geq 0
  9. 如果M>0M>0为实系数矩阵,那么存在δ>0\delta>0 使得MδIM\geq \delta I,其中II单位矩阵

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册