![机器学习数学基础](https://wfqqreader-1252317822.image.myqcloud.com/cover/482/43738482/b_43738482.jpg)
2.4.1 计算方法和意义
行列式是由一些按照某种方式排列的方阵所确定的一个数,这种思想最早是由日本数学家关孝和(1683年),以及德国数学家莱布尼茨(1693年,Gottfried Wilhelm (von)Leibniz)分别独立提出的,瑞士数学家克拉默(1750年,Gabriel Cramer)和法国数学家柯西(1812年,Augustin Louis Cauchy)将其应用在线性方程组中。此后人们对行列式进行了系统化研究,形成了现在线性代数教材中关于行列式的知识。教材中常常在介绍了2阶和3阶行列式计算方法之后,给出阶行列式计算公式:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_596.jpg?sign=1739275384-YISxzgX4iprC2nxnovdstXwg8BYYAuWv-0-394feb222c2daefe66b8c13e40f98c36)
其中表示逆序数。
关于逆序数的概念和对本公式的详细介绍,请参阅丘维声先生的《高等代数》一书。本书不对手工计算行列式的方法进行详细阐述,但是,对于行列式的含义,仍然需要理解,因为它能够帮助我们理解某些理论问题,另外,简单的行列式计算,如阶方阵
的行列式
,还是应该掌握的。
通常,用或
表示方阵的行列式,其中
是
的矩阵。
下面重点以阶方阵的行列式为例,介绍行列式的几何意义,以及由此得到的推论。
如图2-4-1所示,向量逆时针旋转(注意此方向)到向量
,以这两个向量为邻边,可以围成一个平行四边形,计算这个平行四边形的面积。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_608.jpg?sign=1739275384-oEjBIgF0TKYOmtGohg7WXrtXnCozTCil-0-5aa9c92205d1fc5de68c5573c0e37ced)
图2-4-1
注意,我们所探讨的问题均在欧几里得空间,即以点积函数作为内积的具体实现(请参阅第1章1.4.2节有关内容)。
在图2-4-1所示的平面空间中,向量和
的长度分别用
和
表示(为了简化,将
范数
简写为
),这两个向量与
轴的夹角分别为
和
,根据几何知识,可知所围成的平行四边形的面积为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_619.jpg?sign=1739275384-dlpjWKyiwoBPFT2ScHaJW7m5fxpARMcj-0-b1e3768c79b41bda5d8958ec48fcf71a)
又因为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_620.jpg?sign=1739275384-ylqalcDDSZCMC2uefeKgU2Ul576FkdDQ-0-d77e8d9f081ec26447e17c263019c538)
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_621.jpg?sign=1739275384-swcadbSnsv2RT3aXR9akFKXocYVmAYz8-0-0d69c8e3f73474837b0428b8614d6df3)
所以,可得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_622.jpg?sign=1739275384-H9alpt35mfsraBpk9UmRCF5Kcz9SUWMq-0-51ff64da216b44e66cf33d383d24a794)
由此可得结论:矩阵的行列式
就是列向量所围成的平四边形的面积。
以上只是证明此结论的一种方法,还有其他一些方法,有兴趣的读者请参阅本书在线资料(地址见前言说明)。
此外,也可以证明由三个线性无关的列向量构成的矩阵的行列式与它们在三维空间中围成的六面体的体积相等。推而广之,可以说:
性质 行列式表征矩阵中线性无关的列向量在空间围成的多面体的体积(如果是二维空间,则退化为平面面积)。
如果矩阵的列向量线性相关,比如对于矩阵,两个列向量在图2-4-2中分别用
和
表示,显然,它们在一条直线上,所围成的图形面积即为
。用行列式的计算公式,亦得
。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_630.jpg?sign=1739275384-aX1zFQyTwrIYBll6Br6u5ububURJ8bF7-0-b44f646d3abb9bb54503ed64f2bbd68d)
图2-4-2
基于上述内容,可推论出矩阵列向量和行列式之间的如下关系:
性质
矩阵列向量线性无关
矩阵列向量线性相关
在2.2.3节曾提到“矩阵就是映射”,下面就从映射的角度理解行列式的意义。
设矩阵,其中
是列向量,则它们围成的多面体体积是:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_635.jpg?sign=1739275384-OcqyiQ4GDqlxsLsod96wfyjJsgvHo60V-0-c4d9b71b9350f6542f5352c4c9ce2359)
如有,其中
为映射,则:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_638.jpg?sign=1739275384-u71gE1vh7lPHp0prmBgkRoov25Bt2WKG-0-b47da8fe08f408254965301aa5f40127)
由此,我们也可以说,行列式表征映射之间的体积(面积)缩放倍数,并且还有以下推论:
● 若,则
,这说明将矩阵
的列向量映射成了线性相关的向量,经过此映射,相当于丢失了原有矩阵
的部分信息,因此,映射
是不可逆的,即方阵
为不可逆矩阵(请结合2.3.1节对可逆矩阵的介绍进行理解)。这种不可逆矩阵还被称为奇异矩阵(Singular Matrix)。
● 若,则意味着经映射
后的矩阵
和原矩阵
的列向量之间有一对一关系,故方阵
为可逆矩阵,也称为非奇异矩阵(Nonsingular Matrix)。
对于行列式的计算,使用NumPy中的np.linalg.det()函数可以很便捷地完成。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_650.jpg?sign=1739275384-uZcesvDBPxSU9mkI2keSqtk4OVvmtkpG-0-238df67fa81167c4e2c2278f7fbe3a7b)
虽然我们不需要手工计算行列式,但在理论分析中会使用它的一些运算性质,下面列出常见的若干项,以便应用时查阅。
性质 矩阵,
为非零的标量(下同),则:
●
●
●
● (假设
存在)
●
● ,
是
的特征值
在历史上,行列式的作用就在于解线性方程组,那么,也有必要对线性方程组及其求解方法有所了解,为将来探讨线性回归问题奠定基础。