![机器学习数学基础](https://wfqqreader-1252317822.image.myqcloud.com/cover/482/43738482/b_43738482.jpg)
1.3.2 基
在1.2.3节就已经发现,对于二维向量空间,任何一个向量都可以用两个线性无关的向量线性表出。同样来思考三维向量空间,也有类似的情况,如图1-3-2所示,向量组是
的一个线性无关的向量组(即:
),此空间中任意一个向量
可以用这三个向量线性表出,但如果给向量组
再增加一个向量,则该向量组不再是线性无关的了,也就是说这个向量组也是一个极大线性无关组。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_332.jpg?sign=1738882936-fBqX8oUzWAKjBVm40eEoTbO0NCwQANfQ-0-242adb70df923e17c63b95bdd5d630e9)
图1-3-2
将得到的以上结论推广到任何向量空间,如果我们都可以找到一个极大线性无关的向量组,用它可线性表出这个向量空间的任何一个向量,那么称这个极大线性无关组为该向量空间的一个基(Basis)。
再如几何空间中的向量组,是极大线性无关组,它构成了几何空间的一个基,几何空间中的任何一个向量同样可以用这三个向量的线性组合表示。只不过,相比于图1-3-2中所示的那个基,这个基不那么“特殊”。
图1-3-2所示的基的特殊性在于:向量长度都是1,且彼此垂直(另外一种称谓是正交,参阅3.4.1节),因此也称其为标准基(Standard Basis,或称标准正交基),例如的一个标准基是:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_335.jpg?sign=1738882936-P5OVvZLvhmz7Bm6L7ZQR929F1wfdbjll-0-73a18a3ffbe89b34223a14f86dccee2f)
(1.3.1)
显然,以上我们所选择的标准基更具有特殊性,即每个向量中只有一个值是非零值。有没有别的标准基呢?是不是标准基都如此?不是!只不过像上面那样选择标准基让向量的描述更简单。如图1-3-3所示,二维向量空间中的向量(以
表示向量对象本身,即不需要依靠任何基以数学形式描述该向量),在标准基
下描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_339.jpg?sign=1738882936-hBGiqnFtt6O9X3h3mttJUrDTvDJ64Y6w-0-090e3a485104f19a49a4fd78ecdf8950)
(1.3.2)
如果在另外一个标准基下描述,则为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_341.jpg?sign=1738882936-hDOkgkGz117Pn9EIzHKXyBJowOlAREOY-0-8bd81ce13865f56beaf6c037d0bff9bb)
(1.3.3)
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_342.jpg?sign=1738882936-OuvI98Hlk38wkjCSk3G1hXsbZuvwx84J-0-5ba0d340b682ec6a0d4222e8e3c5e9ab)
图1-3-3
比较一下,哪个更简单?一目了然。所以,基于样式的标准基描述空间的向量,更符合我们的意愿。事实上,当我们用线性代数的方式将向量表示出来的时候,就已经为它选定了一个基——向量必须在向量空间的一个基下才能描述。例如,向量
,在我们没有明确说明它的基的时候,事实上已经默认了一个基:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_345.jpg?sign=1738882936-pOU8TqJj1PGPGXMwcGMh8VfkWCVUNJu9-0-74f79ae36f861381c67ec7abbe060d35)
类似于(1.3.1)式的基是我们常用的向量空间的默认基。
如果以基中每个向量所在方向的直线为坐标轴,如图1-3-3所示,就创建了一个坐标系(Coordinate System)。很显然,不同的基所创建的坐标系是不同的,图1-3-3分别以实线和虚线表示了上述两个基所对应的坐标系。
(1.3.2)式和(1.3.3)式分别用不同的基描述向量,其中系数
或者
,称为坐标。
如果对进行乘法和加法运算,就得到了
。由此可见,在这个坐标系中,向量的描述和坐标是完全一致的,并且符合我们的直观感觉。所以,在讨论某个空间的列向量或者行向量的时候,如果写成了类似这样的方式,就意味着该向量是基于空间的
标准基描述的(回顾1.1节对向量的描述)。
把上述经验推广到其他向量空间,设(
表示列向量)是某个向量空间的一个基,则该空间中一个向量
可以描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_355.jpg?sign=1738882936-xqrUzkj8IsjMobxf2nepfc9KyJPxE0Xh-0-86f41b176511cd5123f49f66e562b33b)
(1.3.4)
其中的即为向量
在基
的坐标。
如果有另外一个基(
表示列向量),向量
又描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_362.jpg?sign=1738882936-fN175auI5yVyPggmsBoXRm2OoK0vCTDn-0-6442ea368bb35c214cabcd4d7e083a7a)
(1.3.5)
那么,同一个向量空间的这两个基有没有关系呢?有。不要忘记,基是一个向量组,例如基中的每个向量也在此向量空间,所以可以用基
线性表出,即:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_365.jpg?sign=1738882936-jsPfEbx6ic7AsxkgiKwrACko5yNeU0HS-0-5c3df43b37d850f73070ff9ba5117832)
以矩阵(这里提前使用了矩阵的概念,是因为本书已经在前言中声明,我们假定读者学过高等数学。关于矩阵的更详细内容,请参阅第2章)的方式,可以表示为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_366.jpg?sign=1738882936-5JuXu42AfAqETIBm8X5uNZNHyGsUR0GN-0-b20498438061ad2f545dfd9aa41ca185)
(1.3.6)
其中:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_367.jpg?sign=1738882936-yiRFGkdhzaxSJkRQBdtqTBOnC9BBUUd6-0-4e2893f0ff0d81ffa9453f162ee70b84)
称为基向基
的过渡矩阵。显然,过渡矩阵实现了一个基向另一个基的变换。
定义 在同一个向量空间,由基向基
的过渡矩阵是
,则:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_373.jpg?sign=1738882936-Qe3hYWxHs6eLZJddb8vVheRRwhhcGRsZ-0-a65449394842a696cef9c774da9c0813)
注意:和
分别用列向量方式表示此向量空间的不同的基。
根据(1.3.5)式,可得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_376.jpg?sign=1738882936-H2wjmZrXQPjMMRBzZc2VHy5quzaAIm6D-0-58081e6d7032dd6e246af0aaf1584378)
(1.3.4)式和(1.3.5)式描述的是同一个向量,所以:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_377.jpg?sign=1738882936-VcG6KNDbsBKR1l9HiGsvPJd9IMGHTgzw-0-45e6be7654f4e892b170c6b8c86a851c)
如果写成矩阵形式,即:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_378.jpg?sign=1738882936-TF5IwcmnaSX42mXyzJLab3vf0UF37wws-0-fc34382dbffcc1dbdd6cc4059e27a1cc)
(1.3.7)
表示了在同一个向量空间中,向量在不同基下的坐标之间的变换关系,我们称之为坐标变换公式。
定义 在某个向量空间中,由基向基
的过渡矩阵是
。某向量在基
下的坐标是
,在基
下的坐标是
,这两组坐标之间的关系是:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_386.jpg?sign=1738882936-GjeIxraDsw5ezAY9TNVAyDHUMiaCce9b-0-f522a515ffef85cfb531826a62adfa8f)
为了更直观地理解上述概念,下面以平面空间为例给予详细说明。如图1-3-4所示,有向量,所对应坐标系如实线
所示(显然,基是
)。此向量空间的另外一个基
所对应的坐标系如虚线
所示。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_392.jpg?sign=1738882936-4eaQMap9PGMESQpVO8l2o2Sxi2xc3cWv-0-eea390e92aee690fea5380da1aeade6e)
图1-3-4
在中,分别以基向量的
和
的长度为单位长度,并以它们的各自方向分别设置为
轴和
轴的正方向。
● 坐标表示向量
的长度在
轴方向上是单位长度的
倍(正数表示与
轴正方向一致);
● 坐标表示向量
的长度在
轴方向上是单位长度的
倍(正数表示与
轴正方向一致)。
同样,在中,分别以基向量的
和
的长度为单位长度并建立
和
坐标轴。如图1-3-4所示,先用几何方法,从
点分别作
和
两个坐标轴的平行线,与坐标轴交点分别为
,则这两个点的数值代表了相对于基向量长度的倍数,即向量
在
中的坐标。由图可知,
,于是,在
中向量
表示为:
。
如果不用几何的方式,采用前述的坐标变换公式,看看能不能得到同样结果。
基向基
的过渡矩阵
,由坐标变换公式(1.3.7)式得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_426.jpg?sign=1738882936-2Zr7fKkpLu5AJ2j6J5einZKFgNJl80FB-0-babd544ec4d4b186adc1f1e8334b0e71)
解得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_427.jpg?sign=1738882936-VWr3x34uHuejo7XVZRYhKU7k0s0PV7NB-0-13ba266f3948af31a01cc214f5a63d1b)
所以:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_428.jpg?sign=1738882936-IsTy6gUcJF7vRS6mFatWMBzU5kO2RRh1-0-3cfee671d56f87193443fa8f51e7e78e)
在中,
,与前述几何方法计算结果一致。