在线性代数里,正定矩阵是埃尔米特矩阵的一种,有时会简称为正定阵。在线性代数中,正定矩阵的性质类似复数中的正实数。与正定矩阵相对应的线性算子是对称正定双线性形式(复域中则对应埃尔米特正定双线性形式)。
正定矩阵的定义
一个n×n的实对称矩阵M是正定的,当且仅当对于所有的非零实系数向量z,都有z^TMz > 0。其中z^T表示z的转置。
对于复数的情况,定义则为:一个n×n的埃尔米特矩阵(或厄米矩阵)M是正定的当且仅当对于每个非零的复向量z,都有z^*Mz > 0。其中z^*表示z的共轭转置。由于M是埃尔米特矩阵,经计算可知,对于任意的复向量z,z^*Mz必然是实数,从而可以与0比较大小。因此这个定义是自洽的。
如何判别正定矩阵
对n×n的埃尔米特矩阵M,下列性质与“M为正定矩阵”等价:
- 矩阵M的所有的特征值\lambda_i都是正的。根据谱定理,M必然与一个实对角矩阵D相似(也就是说M = P^{-1}DP ,其中P是幺正矩阵,或者说M在某个正交基可以表示为一个实对角矩阵)。因此,M是正定阵当且仅当相应的D的对角线上元素都是正的。
- 半双线性形式
\langle \textbf{x},\textbf{y}\rangle = \textbf{x}^{*} M \textbf{y}
定义了一个C^n上的内积。实际上,所有C^n上的内积都可看做由某个正定阵通过此种方式得到。 -
$$M$$是n个线性无关的k维向量$$x_1,\ldots,x_n \in \mathbb{C}^k$$的Gram矩阵,其中的k为某个正整数。更精确地说,$$M$$定义为:
$$M_{ij} = \langle \textbf{x}_i, \textbf{x}_j\rangle = \textbf{x}_i^{*} \textbf{x}_j$$.
换句话说,$$M$$具有$$A^*A$$的形式,其中A不一定是方阵,但需要是单射的。 -
$$M$$的所有顺序主子式,也就是顺序主子阵的行列式都是正的(西尔维斯特准则)。明确来说,就是考察下列矩阵的行列式:
$$M$$左上角1×1的矩阵
$$M$$左上角2×2矩阵
…
$$M$$自身。
对于半正定矩阵来说,相应的条件应改为所有的主子式非负。顺序主子式非负并不能推出矩阵是半正定的。比如以下例子:
$$ \begin{bmatrix}
1 & 1 & 1 \\
1 & 1 & 1 \\
1 & 1 & 0
\end{bmatrix} $$
5. 存在唯一的下三角矩阵$$L$$,其主对角线上的元素全是正的,使得:
$$M=L L^*$$.
其中$$L^*$$是$$L$$的共轭转置。 T这一分解被称为Cholesky分解。
对于实对称矩阵,只需将上述性质中的\mathbb{C}^n改为\mathbb {R} ^{n},将“共轭转置”改为“转置”就可以了。
二次型
由以上的第二个等价条件,可以得到二次型形式下正定矩阵的等价条件:用\mathbb {K} 代表\mathbb {C} 或\mathbb {R} ,设\mathbb{V}是\mathbb {K} 上的一个向量空间。一个埃尔米特型:
B : V \times V \rightarrow K
是一个双线性映射,使得B(x, y)总是B(y, x)的共轭。这样的一个映射B是正定的当且仅当对\mathbb{V}中所有的非零向量x,都有B(x, x) > 0。
负定、半定及不定矩阵
与正定矩阵相对应的,一个n×n的埃尔米特矩阵M是负定矩阵(英语:negative definite matrix)当且仅当对所有不为零的{\displaystyle z\in \mathbb {R} ^{n}}(或{\displaystyle z\in \mathbb {C} ^{n}}),都有:
{\displaystyle z^{*}Mz<0\,}
M是半正定矩阵(英语:positive semi-definite matrix)当且仅当对所有不为零的{\displaystyle z\in \mathbb {R} ^{n}}(或{\displaystyle z\in \mathbb {C} ^{n}}),都有:
{\displaystyle z^{*}Mz\geq 0}
M是半负定矩阵(英语:negative semi-definite matrix)当且仅当对所有不为零的{\displaystyle z\in \mathbb {R} ^{n}}(或{\displaystyle z\in \mathbb {C} ^{n}}),都有:
{\displaystyle z^{*}Mz\leq 0}
如果一个埃尔米特矩阵既不是半正定也不是半负定的,那么称其为不定矩阵(英语:indefinite matrix)。
可以看出,上一节中正定阵的等价性质1只需略作相应改动,就可以变为判别负定矩阵、半正定矩阵和半负定矩阵的准则。注意当M是半正定时,相应的Gram矩阵不必由线性无关的向量组成。对任意矩阵A,A^*A必然是半正定的,并有rank(A) = rank(A^*A,两者的秩相等)。反过来,任意的半正定矩阵都可以写作M = A*A,这就是Cholesky分解。
一个埃尔米特矩阵M是负定矩阵当且仅当M的所有奇数阶顺序主子式小于0,所有偶数阶顺序主子式大于0。当M是负定矩阵时,M的逆矩阵也是负定的。
正定矩阵的性质
若M为半正定阵,可以写作M \geq 0 。如果M是正定阵,可以写作M > 0。这个记法来自泛函分析,其中的正定阵定义了正算子。
对于一般的埃尔米特矩阵,M、N,M\geq N 当且仅当M-N \geq 0 。这样可以定义一个在埃尔米特矩阵集合上的偏序关系。类似地,可以定义M>N。
- 每个正定阵都是可逆的,它的逆也是正定阵。如果M \geq N > 0 那么N^{-1} \geq M^{-1} > 0。
-
如果M是正定阵,r > 0为正实数,那么r M也是正定阵。
如果M、N是正定阵,那么和M + N、乘积MNM与NMN都是正定的。如果M N = N M,那么M N仍是正定阵。 -
如果M=(m_{ij}) > 0 那么主对角线上的系数m_{ii} 为正实数。于是有\text{tr}(M)>0 。此外还有
| m_{ij} | \leq \sqrt{m_{ii} m_{jj}} \leq \frac{m_{ii}+m_{jj}}{2}. - 矩阵M是正定阵当且仅当存在唯一的正定阵B>0 使得B^2 = M 。根据其唯一性可以记作B = M^{1/2} ,称B为M的平方根。对半正定阵也有类似结论。同时,如果M > N > 0 那么M^{1/2} > N^{1/2}>0.
- 如果M,N > 0 那么M\otimes N > 0 ,其中\otimes表示克罗内克乘积。
-
对矩阵M=(m_{ij}),N=(n_{ij}) ,将两者同一位置上的系数相乘所得的矩阵记为M\circ N,即M\circ N_{i,j}=m_{ij} n_{ij} ,称为M与N的阿达马乘积。如果M,N>0 ,那么M\circ N > 0。如果M,N 为实系数矩阵,则有如下不等式成立:
\det(M\circ N) \geq (\det N) \prod_{i} m_{ii}. -
设M > 0 ,N为埃尔米特矩阵。如果
MN+NM \geq 0 (MN+NM > 0 ),那么N\geq 0(N > 0)。 - 如果M,N\geq 0为实系数矩阵,则\text{tr}(MN)\geq 0。
- 如果M>0为实系数矩阵,那么存在\delta>0 使得M\geq \delta I,其中I 为单位矩阵。