正定矩阵

在线性代数里,正定矩阵是埃尔米特矩阵的一种,有时会简称为正定阵。在线性代数中,正定矩阵的性质类似复数中的正实数。与正定矩阵相对应的线性算子是对称正定双线性形式(复域中则对应埃尔米特正定双线性形式)。

正定矩阵的定义

一个n×n的实对称矩阵M是正定的,当且仅当对于所有的非零实系数向量z,都有z^TMz > 0。其中z^T表示z的转置。

对于复数的情况,定义则为:一个n×n的埃尔米特矩阵(或厄米矩阵)M是正定的当且仅当对于每个非零的复向量z,都有z^*Mz > 0。其中z^*表示z的共轭转置。由于M是埃尔米特矩阵,经计算可知,对于任意的复向量zz^*Mz必然是实数,从而可以与0比较大小。因此这个定义是自洽的。

如何判别正定矩阵

n×n的埃尔米特矩阵M,下列性质与“M为正定矩阵”等价:

  1. 矩阵M的所有的特征值\lambda_i都是正的。根据谱定理,M必然与一个实对角矩阵D相似(也就是说M = P^{-1}DP ,其中P是幺正矩阵,或者说M在某个正交基可以表示为一个实对角矩阵)。因此,M是正定阵当且仅当相应的D的对角线上元素都是正的。
  2. 半双线性形式
    \langle \textbf{x},\textbf{y}\rangle = \textbf{x}^{*} M \textbf{y}
    定义了一个C^n上的内积。实际上,所有C^n上的内积都可看做由某个正定阵通过此种方式得到。

  3. M是n个线性无关的k维向量x_1,\ldots,x_n \in \mathbb{C}^k的Gram矩阵,其中的k为某个正整数。更精确地说,M定义为:
    M_{ij} = \langle \textbf{x}_i, \textbf{x}_j\rangle = \textbf{x}_i^{*} \textbf{x}_j.
    换句话说,M具有A^*A的形式,其中A不一定是方阵,但需要是单射的。

  4. M的所有顺序主子式,也就是顺序主子阵的行列式都是正的(西尔维斯特准则)。明确来说,就是考察下列矩阵的行列式:
    M左上角1×1的矩阵
    M左上角2×2矩阵

    M自身。
    对于半正定矩阵来说,相应的条件应改为所有的主子式非负。顺序主子式非负并不能推出矩阵是半正定的。比如以下例子:

\begin{bmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 0 \end{bmatrix}
5. 存在唯一的下三角矩阵L,其主对角线上的元素全是正的,使得:
M=L L^*.
其中L^*L的共轭转置。 T这一分解被称为Cholesky分解。

对于实对称矩阵,只需将上述性质中的\mathbb{C}^n改为\mathbb {R} ^{n},将“共轭转置”改为“转置”就可以了。

二次型

由以上的第二个等价条件,可以得到二次型形式下正定矩阵的等价条件:用\mathbb {K} 代表\mathbb {C}\mathbb {R} ,设\mathbb{V}\mathbb {K} 上的一个向量空间。一个埃尔米特型:

B : V \times V \rightarrow K
是一个双线性映射,使得B(x, y)总是B(y, x)的共轭。这样的一个映射B是正定的当且仅当对\mathbb{V}中所有的非零向量x,都有B(x, x) > 0。

负定、半定及不定矩阵

与正定矩阵相对应的,一个n×n的埃尔米特矩阵M是负定矩阵(英语:negative definite matrix)当且仅当对所有不为零的{\displaystyle z\in \mathbb {R} ^{n}}(或{\displaystyle z\in \mathbb {C} ^{n}}),都有:

{\displaystyle z^{*}Mz<0\,}
M是半正定矩阵(英语:positive semi-definite matrix)当且仅当对所有不为零的{\displaystyle z\in \mathbb {R} ^{n}}(或{\displaystyle z\in \mathbb {C} ^{n}}),都有:

{\displaystyle z^{*}Mz\geq 0}
M是半负定矩阵(英语:negative semi-definite matrix)当且仅当对所有不为零的{\displaystyle z\in \mathbb {R} ^{n}}(或{\displaystyle z\in \mathbb {C} ^{n}}),都有:

{\displaystyle z^{*}Mz\leq 0}
如果一个埃尔米特矩阵既不是半正定也不是半负定的,那么称其为不定矩阵(英语:indefinite matrix)。

可以看出,上一节中正定阵的等价性质1只需略作相应改动,就可以变为判别负定矩阵、半正定矩阵和半负定矩阵的准则。注意当M是半正定时,相应的Gram矩阵不必由线性无关的向量组成。对任意矩阵AA^*A必然是半正定的,并有rank(A) = rank(A^*A,两者的秩相等)。反过来,任意的半正定矩阵都可以写作M = A*A,这就是Cholesky分解。

一个埃尔米特矩阵M是负定矩阵当且仅当M的所有奇数阶顺序主子式小于0,所有偶数阶顺序主子式大于0。当M是负定矩阵时,M的逆矩阵也是负定的。

正定矩阵的性质

M为半正定阵,可以写作 M \geq 0 。如果M是正定阵,可以写作 M > 0 。这个记法来自泛函分析,其中的正定阵定义了正算子。

对于一般的埃尔米特矩阵,MN M\geq N 当且仅当 M-N \geq 0 。这样可以定义一个在埃尔米特矩阵集合上的偏序关系。类似地,可以定义M>N

  1. 每个正定阵都是可逆的,它的逆也是正定阵。如果 M \geq N > 0 那么 N^{-1} \geq M^{-1} > 0
  2. 如果M是正定阵,r > 0为正实数,那么r M也是正定阵。
    如果MN是正定阵,那么和M + N、乘积MNMNMN都是正定的。如果M N = N M,那么M N仍是正定阵。

  3. 如果 M=(m_{ij}) > 0 那么主对角线上的系数 m_{ii} 为正实数。于是有\text{tr}(M)>0 。此外还有
    | m_{ij} | \leq \sqrt{m_{ii} m_{jj}} \leq \frac{m_{ii}+m_{jj}}{2}.

  4. 矩阵M是正定阵当且仅当存在唯一的正定阵 B>0 使得 B^2 = M 。根据其唯一性可以记作 B = M^{1/2} ,称 BM的平方根。对半正定阵也有类似结论。同时,如果 M > N > 0 那么 M^{1/2} > N^{1/2}>0 .
  5. 如果 M,N > 0 那么 M\otimes N > 0 ,其中\otimes表示克罗内克乘积。
  6. 对矩阵 M=(m_{ij}),N=(n_{ij}) ,将两者同一位置上的系数相乘所得的矩阵记为 M\circ N ,即M\circ N_{i,j}=m_{ij} n_{ij} ,称为MN的阿达马乘积。如果 M,N>0 ,那么 M\circ N > 0 。如果 M,N 为实系数矩阵,则有如下不等式成立:
    \det(M\circ N) \geq (\det N) \prod_{i} m_{ii}.

  7. M > 0N为埃尔米特矩阵。如果
    MN+NM \geq 0 MN+NM > 0 ),那么 N\geq 0 N > 0)。

  8. 如果M,N\geq 0为实系数矩阵,则\text{tr}(MN)\geq 0
  9. 如果 M>0为实系数矩阵,那么存在 \delta>0 使得 M\geq \delta I,其中 I单位矩阵

赞(0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

最新文章