【数学基础】第七课:矩阵与向量

矩阵定义,常见的矩阵类型,矩阵的基本运算,向量定义,常见的向量类型,向量的基本运算

Posted by x-jeff on August 27, 2019

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。

1.矩阵的基本概念

在数学中,矩阵(matrix)是一个按照长方阵列排列的复数或实数集合。通常使用小括号包裹起来(有的地方会使用中括号)。

由$m\times n$个数$a_{ij}$排成的m行n列的矩阵,简称$m\times n$矩阵。记作:

\[A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix}\]

这$m\times n$个数称为矩阵A的元素,简称为,数$a_{ij}$位于矩阵A的第i行第j列,称为矩阵A的(i,j)元,以数$a_{ij}$为(i,j)元的矩阵可记为$(a_{ij})$或$(a_{ij})_{m\times n}$,$m\times n$矩阵A也记作$A_{mn}$。

元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵

1.1.矩阵的迹(trace)

在线性代数中,一个$n\times n$矩阵A的主对角线上各元素的总和被称为矩阵A的(或迹数),一般记为$tr(A)$。

1.2.矩阵的秩(rank)

在线性代数中,一个矩阵A的列秩是A的线性独立的纵列的极大数目。类似的,行秩是A的线性无关的横行的极大数目。

矩阵的列秩和行秩总是相等的,因此它们可以简单地称作矩阵A的秩。通常表示为$r(A),rank(A)$或$rk(A)$。

2.矩阵类型

矩阵有很多特殊的类型,这里仅介绍几种常见的类型。

2.1.同型矩阵

如果这两个或者两个以上的矩阵的行数和列数都相同,那么就说这两个或两个以上的矩阵是同型矩阵

2.2.方阵

行数与列数都等于n的矩阵称为n阶矩阵n阶方阵

2.3.单位矩阵

在矩阵乘法中,有一种矩阵起着特殊的作用,如同数的乘法中的1,这种矩阵被称为单位矩阵。它是个方阵,从左上角到右下角的对角线(称为主对角线)上的元素均为1,除此以外全都为0。即:

\[\begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \\ \end{pmatrix}\]

⚠️任何矩阵与单位矩阵相乘都等于本身。

单位矩阵通常用E表示。

2.4.转置矩阵

将矩阵的行列互换得到的新矩阵称为转置矩阵。例如矩阵A的转置矩阵(记为$A^T$)为:

\[\begin{pmatrix} a_{11} & a_{21} & \cdots & a_{m1} \\ a_{12} & a_{22} & \cdots & a_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{mn} \\ \end{pmatrix}\]

有定义可知,A为$m\times n$矩阵,则$A^T$为$n\times m$矩阵。

⚠️转置矩阵的行列式不变。

👉运算性质:

  1. $(A^T)^T=A$
  2. $(A+B)^T=A^T+B^T$
  3. $(kA)^T=kA^T$
  4. $(AB)^T=B^TA^T$
  5. $\det (A^T)=\det(A)$

2.5.对称矩阵和反对称矩阵

如果n阶方阵和它的转置相等,即$A^T=A$,则称矩阵A为对称矩阵

如果$A^T=-A$,则称矩阵A为反对称矩阵

2.6.伴随矩阵

设矩阵$A=(a_{ij})_{n\times n}$,将矩阵A的元素$a_{ij}$所在的第i行第j列元素划去后,剩余的$(n-1)^2$,各元素按原来的排列顺序组成的n-1阶矩阵所确定的行列式称为元素$a_{ij}$的【余子式】,记为$M_{ij}$,称$A_{ij}=(-1)^{i+j}M_{ij}$为元素$a_{ij}$的【代数余子式】

  • $a_{ij}$ 为矩阵A的元素/元。
  • $M_{ij}$为元素$a_{ij}$的余子式
  • $A_{ij}$为元素$a_{ij}$的代数余子式

方阵$A=(a_{ij})_{n\times n}$的各元素的代数余子式$A_{ij}$所构成的如下矩阵$A^*$:

\[\begin{pmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \\ \end{pmatrix}\]

该矩阵$A^*$称为矩阵A的伴随矩阵

2.7.逆矩阵

设A是数域上的一个n阶方阵,若在相同数域上存在另一个n阶方阵B,使得:$AB=BA=E$。则我们称B是A的逆矩阵,而A则被称为可逆矩阵。(E为单位矩阵。)

A的逆矩阵记为$A^{-1}$。

👉逆矩阵的性质:

  1. 可逆矩阵一定是方阵。
  2. 如果矩阵A是可逆的,其逆矩阵是唯一的。
  3. A的逆矩阵的逆矩阵还是A,记作$(A^{-1})^{-1}=A$。
  4. 可逆矩阵A的转置矩阵$A^T$也可逆,并且$(A^T)^{-1}=(A^{-1})^T$。
  5. 若矩阵A可逆,则矩阵A满足消去率:
    • AB=0(或BA=0),则B=0。
    • AB=AC(或BA=CA),则B=C。
  6. 两个可逆矩阵的乘积依然可逆。
  7. 矩阵可逆当且仅当它是满秩矩阵。

关于性质5:

矩阵乘积一般不满足消去率,即已知AB=0,一般推不出A=0(或B=0);或者说,已知AX=AY一般推不出X=Y。例如:

$\begin{pmatrix} 1 & 0 \\ 0 & 0 \\ 3 & 0 \ \end{pmatrix}\times \begin{pmatrix} 2 \\ 1 \ \end{pmatrix}=\begin{pmatrix} 2 \\ 0 \\ 6 \ \end{pmatrix}$

$\begin{pmatrix} 1 & 0 \\ 0 & 0 \\ 3 & 0 \ \end{pmatrix}\times \begin{pmatrix} 2 \\ 3 \ \end{pmatrix}=\begin{pmatrix} 2 \\ 0 \\ 6 \ \end{pmatrix}$

只有在矩阵可逆的情况下,才满足消去率。

2.8.满秩矩阵

设A是n阶矩阵(方阵),若$r(A)=n$,则称A为满秩矩阵

❗️但满秩不局限于n阶方阵:

  • 若矩阵秩等于行数,称为行满秩
  • 若矩阵秩等于列数,称为列满秩

2.9.正定矩阵、半正定矩阵、负定矩阵、半负定矩阵

设A是n阶方阵,若对于每个非零实向量X,都有:

  • $X^TAX\geqslant 0$,就称A为半正定矩阵
  • $X^TAX>0$,就称A为正定矩阵
  • $X^TAX\leqslant 0$,就称A为半负定矩阵
  • $X^TAX<0$,就称A为负定矩阵

3.矩阵的运算

3.1.加减乘除

3.1.1.矩阵加法

⚠️只有同型矩阵之间才可以进行加法。

\[\begin{pmatrix} 1 & 4 & 2 \\ 2 & 0 & 0 \\ \end{pmatrix} + \begin{pmatrix} 0 & 0 & 5 \\ 7 & 5 & 0 \\ \end{pmatrix}=\begin{pmatrix} 1+0 & 4+0 & 2+5 \\ 2+7 & 0+5 & 0+0 \\ \end{pmatrix}=\begin{pmatrix} 1 & 4 & 7 \\ 9 & 5 & 0 \\ \end{pmatrix}\]

3.1.2.矩阵减法

⚠️只有同型矩阵之间才可以进行减法。

\[\begin{pmatrix} 1 & 4 & 2 \\ 2 & 0 & 0 \\ \end{pmatrix} - \begin{pmatrix} 0 & 0 & 5 \\ 7 & 5 & 0 \\ \end{pmatrix}=\begin{pmatrix} 1-0 & 4-0 & 2-5 \\ 2-7 & 0-5 & 0-0 \\ \end{pmatrix}=\begin{pmatrix} 1 & 4 & -3 \\ -5 & -5 & 0 \\ \end{pmatrix}\]

3.1.3.矩阵乘法

3.1.3.1.与数相乘

\[\begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ \end{pmatrix}\times 3 = \begin{pmatrix} 3 & 6 & 9 \\ 12 & 15 & 18 \\ \end{pmatrix}\]

3.1.3.2.与矩阵相乘

两个矩阵的乘法仅当第一个矩阵A的列数和另一个矩阵B的行数相等时才能定义。如A是$m\times n$矩阵和B是$n\times p$矩阵,它们的乘积C是一个$m\times p$矩阵$C=(c_{ij})$,记作$C=AB$。例如:

\[\begin{pmatrix} 1 & 0 & 2 \\ -1 & 3 & 1 \\ \end{pmatrix}\times \begin{pmatrix} 3 & 1 \\ 2 & 1 \\ 1 & 0 \\ \end{pmatrix}=\begin{pmatrix} (1\times 3+0\times 2 +2\times 1) & (1\times 1+0\times 1+2\times 0) \\ (-1\times 3+3\times 2+1\times 1) & (-1\times 1+3\times 1+1\times 0) \\ \end{pmatrix}=\begin{pmatrix} 5 & 1 \\ 4 & 2 \\\end{pmatrix}\]

3.1.4.矩阵除法

实际上并不存在矩阵除法,所谓的矩阵除法其实是乘上其逆矩阵。

若A和B是维数相同的两个方阵,且B为可逆矩阵,则矩阵A除以矩阵B相当于是矩阵B的逆矩阵乘上矩阵A:

\[A/B=B^{-1}A\]

⚠️因为矩阵乘法并没有交换律,所以通常有$B^{-1}A\neq AB^{-1}$。

3.2.行列式

行列式在数学中,是一个函数,其定义域为det的矩阵A,取值为一个标量,写作det(A)或$\mid A\mid$(即矩阵A的)。

⚠️行列式仅存在于方阵,称为n阶行列式

假设方阵A为:

\[\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{pmatrix}\] \[\det(A)=\mid A \mid=\sum_{p_1,p_2,\cdots ,p_n} (-1)^{\mathcal{T}(p_1,p_2,\cdots ,p_n)}a_{1p_1}a_{2p_2}\cdots a_{np_n}\]

其中$p_1,p_2,\cdots ,p_n$为n个自然数$1,2,\cdots ,n$的某一排列,$\mathcal{T}(p_1,p_2,\cdots ,p_n)$为排列$p_1,p_2,\cdots ,p_n$的逆序数,$\sum_{p_1,p_2,\cdots ,p_n}$表示对$p_1,p_2,\cdots ,p_n$的所有排列求和。

逆序数:

举个例子:确定5级排列的逆序数。

在排列42531中,

  • 4排在首位,前面没有比它大的数,故不构成逆序
  • 2排在第二位,前面有一个数比它大,故构成一个逆序
  • 5排在第三位,前面没有比它大的数,故不构成逆序
  • 3排在第四位,前面有2个数比它大,故构成2个逆序
  • 1排在第五位,前面有4个数比它大,故构成4个逆序

于是排列42531的逆序数为:$\mathcal{T}(42531)=0+1+0+2+4=7$

⚠️$\det(A)=\det(A^T)$

3.2.1.逆矩阵和行列式

\[A^{-1}=\frac{1}{\mid A \mid}A^*\]

3.3.矩阵求导

矩阵求导有三种情况:

  1. 矩阵对标量求导
  2. 标量对矩阵求导
  3. 矩阵对矩阵求导

本文只讲解前两种情况。

3.3.1.矩阵对标量求导

矩阵$Y=(y_{ij})_{m\times n}$。

\[\frac{\partial \mathbf Y}{\partial x}=\begin{pmatrix} \frac{\partial y_{11}}{\partial x} & \frac{\partial y_{12}}{\partial x} & \cdots & \frac{\partial y_{1n}}{\partial x} \\ \frac{\partial y_{21}}{\partial x} & \frac{\partial y_{22}}{\partial x} & \cdots & \frac{\partial y_{2n}}{\partial x} \\ \vdots & \vdots & \ddots & \vdots \\ \frac{\partial y_{m1}}{\partial x} & \frac{\partial y_{m2}}{\partial x} & \cdots & \frac{\partial y_{mn}}{\partial x} \\ \end{pmatrix}\]

3.3.2.标量对矩阵求导

矩阵$X=(x_{ij})_{p\times q}$。(⚠️注意:矩阵做了转置。)

\[\frac{\partial y}{\partial \mathbf X}=\begin{pmatrix} \frac{\partial y}{\partial x_{11}} & \frac{\partial y}{\partial x_{21}} & \cdots & \frac{\partial y}{\partial x_{p1}} \\ \frac{\partial y}{\partial x_{12}} & \frac{\partial y}{\partial x_{22}} & \cdots & \frac{\partial y}{\partial x_{p2}} \\ \vdots & \vdots & \ddots & \vdots \\ \frac{\partial y}{\partial x_{1q}} & \frac{\partial y}{\partial x_{2q}} & \cdots & \frac{\partial y}{\partial x_{pq}} \\ \end{pmatrix}\]

4.向量的定义

向量也称为矢量,指具有大小和方向的量。

👉坐标表示:

\[\vec{a}=(x_0,y_0)\]

👉矩阵表示($n\times 1$):

\[\mathbf a=\begin{pmatrix} x_0 \\ y_0 \\ \end{pmatrix}\]

5.向量相关定义

5.1.向量的模

向量的大小,也就是向量的长度(或称)。

向量$\mathbf a$的模记作$\mid \mathbf a \mid$。

若向量$\vec a=(x,y)$,则$\mid \vec a \mid=\sqrt{x^2+y^2}$。

⚠️因为方向不能比较大小,所以向量也就不能比较大小。

5.2.单位向量

长度为一个单位(即模为1)的向量,叫做单位向量。与$\mathbf a$同向,且长度为单位1的向量,叫做$\mathbf a$方向上的单位向量

5.3.负向量

如果向量AB与向量CD的模相等且方向相反,那么把向量AB叫做向量CD的负向量,也称为相反向量

5.4.零向量

长度为0的向量叫做零向量,记作$\mathbf 0$。

零向量的始点和终点重合,所以零向量没有确定的方向,或说零向量的方向是任意的。

5.5.相等向量

长度相等且方向相同的向量叫做相等向量。可记作$\mathbf a=\mathbf b$。

⚠️所有的零向量都相等。

5.6.位置向量

对于坐标平面内的任意一点P,我们把向量OP叫做点P的位置向量,其中O点为坐标原点。

5.7.方向向量

直线l上的向量$\mathbf a$以及与向量$\mathbf a$共线的向量叫做直线l上的方向向量

5.8.平行向量

方向相同或相反的非零向量叫做平行(或共线)向量。可记作$\mathbf a // \mathbf b$。

⚠️零向量与任一向量平行。

5.9.法向量

直线l垂直于平面$\alpha$,取直线l的方向向量$\mathbf a$,则向量$\mathbf a$叫做平面$\alpha$的法向量

6.向量的基本运算

设$\mathbf a=(m_1,m_2,\cdots,m_k);\mathbf b=(n_1,n_2,\cdots,n_k)$。

6.1.向量加法

\[\mathbf a+\mathbf b=(m_1+n_1,m_2+n_2,\cdots,m_k+n_k)\]

向量加法的几何意义见下图(平行四边形法则):

6.2.向量减法

\[\mathbf a-\mathbf b=(m_1-n_1,m_2-n_2,\cdots,m_k-n_k)\]

向量减法的几何意义见下图(三角形法则):

6.3.数乘

有实数$\lambda$:

\[\lambda \mathbf a=(\lambda m_1,\lambda m_2,\cdots,\lambda m_k)\]
  • 当$\lambda > 0$时,$\lambda \mathbf a$的方向与$\mathbf a$的方向相同。
  • 当$\lambda < 0$时,$\lambda \mathbf a$的方向与$\mathbf a$的方向相反。
  • 当$\lambda = 0$时,$\lambda \mathbf a=\mathbf 0$,方向任意。

6.4.数量积

向量的数量积又称内积、点积(❗️得到的是一个数值):

\[\mathbf a \cdot \mathbf b=m_1n_1+m_2n_2+\cdots+m_kn_k\]

几何意义(⚠️只对二维和三维空间有效):

\[\vec a \cdot \vec b=\mid \vec a \mid \mid \vec b \mid \cos \theta\]

6.5.向量积

向量的向量积又称外积、叉积(❗️得到的是一个向量)。记作$\mathbf a \times \mathbf b$,这里的“$\times$”并不是乘号,只是一种表示方法,与“$\cdot$”不同,也可记作“$\wedge$”。向量积具体的计算方法本文不再详述。

7.参考资料

  1. 矩阵(百度百科)
  2. 单位矩阵(百度百科)
  3. 转置矩阵(百度百科)
  4. 矩阵和数组及其运算
  5. 矩阵微积分(维基百科)
  6. 向量(百度百科)