Mind and Hand Help

Linear Transformation

研究向量空间上结构不变的映射,这允许我们定义坐标的概念。之前我们说过向量相加并乘以标量得到的对象仍然是一个向量。这里我们希望在应用映射时保留此特性:

考虑两个实数向量空间, 。对于 ,映射 保持向量空间结构不变需满足:

可以用定义来概括

定义 线性映射

对于向量空间 ,如果

则称 线性映射(Linear Mapping) ,或 向量空间同态(vector space homomorphism)线性变换(linear transformation)

这使得我们可以把线性映射用矩阵表示。之前的内容:将向量集合用矩阵的列表示。在处理矩阵的时候,我们必须判断矩阵所表示的内容:是线性映射还是向量集合。后面会看到关于更多的线性映射的内容,介绍一些特殊映射

定义 单射,满射,双射

考虑一个映射 ,其中 是任意集合。那么 可以是

  • 单射的(Injective):

  • 满射的(Surjective):

  • 双射的(Bijective): 既是单射的,也是满射的

如果 是满射的,那么 中的每个元素都可以通过 “到达”。单射意味着映射结果相同的元素为同一元素。双射既是单射的也是满射的,所以一个双射映射 可以“撤销”(双射映射意味着两个空间的个体是一一对应的,所以可以撤销;而非双射这种多对一的情况,“撤销”后的对象是不唯一,不确定是哪一个,所以无法撤销。)即存在一个映射 ,使得 。映射 被称为 的逆,通常用 表示。

在这些定义下,介绍一些向量空间之间线性映射的特殊情况

  • 同态(Homomorphism) 线性

  • 同构(Isomorphism) 双射

  • 自同态(Endomorphism) 线性

  • 自同构(Automorphism) 双射

  • 定义 中的恒等映射或单位自同构(identity mapping or identity automorphism)

同态

是同态映射。

这也证明了为什么复数可以在 中表示为元组:有一个双射线性映射,它将 中的元组的元素加法转换为具有相应加法的复数集。注意,这里我们只展示了线性,而没有双射。

定理2.17

有限维向量空间 同构当且仅当

定理2.17指出在两个相同维度的向量空间之前存在一个线性的双射映射。直觉上,意味着相同维度的向量空间是相同的,它们可以相互转化而不产生任何误差。

定理2.17也给出了之前将 -矩阵 张成的向量空间)和 ( 的向量张成的向量空间)视为相同的理由:因为它们的维数都是 ,所以存在一个线性双射映射,将它们互相转换。(注意:向量空间的维数,由向量张成的向量空间的维数,以及由矩阵张成的向量空间的维数的区别)

备注

考虑向量空间

  • 对于线性映射 ,那么 也是线性映射。

  • 如果 同构,那么 也是同构的。

  • 如果 都是线性的(同态的),那么 也是线性的(同态的)。

线性映射的矩阵表示

任何 维向量空间同构于 (定理2.17)。我们考虑 维向量的空间 的一个基 。在下文中,基向量的顺序很重要。我们对集进行排序,得到

并称这个 元组为 有序基(ordered basis)

备注 :基需要是有序的,所谓的“第一个坐标,第二个坐标,等”才是有意义的

备注 :目前为止定义的符号有点多,在这里总结以下

  • 为有序基

  • 为(无序的)基

  • 是列为 的矩阵

定义 坐标

考虑一个向量空间 以及 的一个有序基 。对于任意的 ,有唯一一个关于 的线性组合

称为: 关于 坐标(Coordinates)

相对于有序基 坐标向量/ 坐标表示(coordinate vector/ coordinate representation)

一个基有效定义了一个坐标系。我们熟悉的笛卡尔坐标系,它由标准基向量 构成。在这个坐标系中,向量 都可以表示为 的线性组合。然而, 的任何基都定义了一个有效的坐标系,同一个向量 基中可能会与 不同的坐标表示。

La 2 8

在图2.8中, 相对于标准基 的坐标为 。然而,关于基 ,相同的向量被表示为 ,即 。在下文中了解如果获得这种表示。

几何向量 相对于 的标准基 的坐标为 。可以将其表示为 。但是不一定选择标准基来表示这个向量。可以选择 为基向量,这样可以得到 相对它们的坐标:

La 2 9

图中 的不同坐标表示取决于不同的基

备注

对于一个 维向量空间 的一个有序基 ,映射 是线性的( 维度相同,所以进一步是同构的),其中 是关于 的标准基。

现在我们准备在 矩阵 和 有限维向量空间 之间的 线性映射 建立一个显示联系

定义2.19 变换矩阵

考虑向量空间 以及相应的有序基 。再考虑线性映射

表示 经过变换后相对 的唯一坐标表示。然后我们得到

我们称 矩阵 (关于 的有序基 和 的有序基)的* 变换矩阵(transformation matrix)*

相对于 的有序基 的坐标是 矩阵 的第 列。

考虑(有限维) 向量空间及其对应的有序基 和变换矩阵

如果 相对于的坐标向量。 相对于 的坐标向量,则

这意味着可以使用变换矩阵将相对于 的有序基的坐标映射到相对于中有序基的坐标。

变换矩阵

考虑 同态映射 以及 的有序基 的有序基 并由:

可得关于 满足 的变换矩阵

其中相对于 的坐标向量

向量的线性变换

La 2 10

图2.10 向量线性变化的三个例子

  • (a) 初始数据

  • (b) 旋转45°

  • (c) 水平坐标拉伸

  • (d) 反射、旋转和拉升的组合

考虑 中的一组向量的三个线性变换及其变换矩阵

图2.10给出了一组向量线性变换的三个例子。图(a) 显示了 中的400个向量,每个向量对应 -坐标 的一个点。向量排列成正方形。

当我们矩阵使用 对这些向量进行线性变换时,我们得到了(b)中被旋转的正方形。

如果 表示的线性映射,我们得到(c)中的矩形,其中每个 坐标 被拉伸2倍。

(d)显示了对原始图形使用 线性变换后的图形, 是反射、旋转和拉伸的组合。

基变换

接下来,我们观察下当改变 的基时,线性映射 是怎样变化的。

考虑 的两个 有序基(ordered basis)

的两个 有序基(ordered basis)

是关于 基 的映射 的变换矩阵。

是关于 基 的映射 的另一个变换矩阵。

下面我们研究需要研究 是什么关系,

即:如果我们选择从基到基 进行基变换,我们是否可以或如何 将 变换成

备注

向量的坐标表示,取决于基(basis)的选择。在图2.9中我们经过恒等映射 得到向量不同的坐标表示。这意味着,在不改变向量的情况下,将它相对于 的坐标映射到相对于的坐标上。通过改变基,从而改变向量的表示,这允许通过一个简单的变换矩阵直接计算实现。

基变换的必要性

考虑一个关于标准基的变换矩阵

如果我们定义一个新基:

可以得到一个关于的对角变换矩阵

它比更容易处理。

在下面,我们将研究将一个基的坐标向量转换成另一个基的坐标向量的映射。我们首先陈述主要结论,然后给出解释。

定理2.20 基变换

对于线性映射 的有序基

的有序基

以及 是关于 的映射的变换矩阵。 是关于相应的变换矩阵,它由以下公式给出:

其中, 的变换矩阵,它将相对于 的坐标映射到 。而 的变换矩阵,它将相对于的坐标映射到

证明

的新基 的向量写成的基向量的线性组合:

同理,把 的新基 的向量写成的基向量的线性组合:

我们定义

  • 为将相对于 的坐标 映射到变换矩阵

  • 是将相对于 的坐标 映射到变换矩阵

特别地, 的 第 列是 相对于的坐标,而的 第 是相对于 的坐标表示。注意 都是正则的(可逆的)

我们将从两个角度来看

第一,通过映射 ,对于 ,我们可以得到

我们首先将新的基向量表示为基向量 的线性组合,然后交换求和顺序。

或者,利用的线性,把表示为 的线性组合,可以得到

比较的两个式子,得出对于所有 ,有:

所以

则:

证毕。

定理2.20 告诉我们,对于变换为 )和 变换为 )的基变换,线性映射的变换矩阵 与等价矩阵替换关系为:

La 2 11

图2.11 对于一个同态映射的有序基 以及 的有序基 (用蓝色标记),我们可以把相对于 的映射 等价地表示为同态映射的组合 ,其中各个符号的下标为该符号对应的基变换对象。 相应的变换矩阵用红色表示。

图2.11 说明了这种关系:考虑一个同态映射 的有序基 以及 的有序基 。映射 的一个实例,它将的基向量映射为的基向量的线性组合。

假设我们已知关于有序基, 的变换矩阵。 当我们在间执行基变换时, 我们可以通过以下步骤得到相应的变换矩阵

首先,我们找到了线性映射的矩阵表示, 它将相对于新基 的坐标映射到相对"旧"基 (在中)的(唯一)坐标上。

然后,我们使用 的变换矩阵将这些坐标映射到相对于中的基的坐标上。

最后,我们使用线性映射 将相对于的坐标 映射到 相对于的坐标上。

因此,我们可以把线性映射 表示为包含"旧"基的线性映射的组合:

具体的说,我们使用 ,即将向量恒等映射到自身所在的向量空间,单相对于不同的基。

定义2.21 等价

如果存在正则矩阵 , 使得 , 则称两矩阵 等价(Equivalence)

定义2.22 相似

如果存在正则矩阵 使得 ,则称两矩阵 相似(Similarity)

备注

相似矩阵总是等价的。然而,等价矩阵不一定相似。

备注

考虑向量空间, , 。从定理2.17后面的备注中, 我们已经知道,对于线性映射 ,映射 也是线性的。 若这两个映射相应的变换矩阵为, 则整个变换矩阵是

鉴于此,我们可以从构建线性映射的角度来看待基的变化:

La 2 111
  • 为关于基 的线性映射 的变换矩阵

  • 为关于基 的线性映射 的变换矩阵

  • 是线性映射 (自同构)的变换矩阵,它用表示 。通常, 中的恒等映射。

  • 是线性映射 (自同构)的变换矩阵,它用表示 。通常, 中的恒等映射。

如果我们(非正式地)用基的形式表示变换,那么有:

  • 以及

注意,(2.116)中的执行顺序是从右向左的,因为向量是在右侧相乘,即

基变换

考虑一个线性映射 的变换矩阵为:

变换相应的标准基为:

我们求 关于新基

的变换矩阵 ,首先求出:

式中, 的第 列是 相对于的基向量的坐标表示。对于一般的基 ,我们需要解一个线性方程组来求 ,使得 。类似地, 的第 列是相对于的基向量的坐标表示。

因此,我们可以得到

在第四章中,我们将利用基变换的概念来寻找一个基,使得自同态的变换矩阵有一个特别简单的(对角)形式。

在第十找章降维中,我们将利用基变换研究一个数据压缩问题,即找到一个基并在这个基上投影数据从而压缩数据,同时最小化压缩损失。

像与核

线性映射的像和核是具有某些重要性质的向量子空间。在下面,我们将详细地描述它们。

定义23像与核(Image and Kernal)

对于 ,我们定义 **核/零空间(e kernel / null space)**为:

以及 像/值域(image / range) 为:

原书籍中 可能有误

我们也分别称的定义域(domain) 和陪域(codomain) 或称为上域、到达域

直观的说,核是被映射到单位元上的 一组向量

像是一组向量 中任何向量都能被 映射"到达" 像。如图2.12所示

La 2 12

图2.12 线性映射 的核与像

备注

考虑线性映射 ,其中 为向量空间

  • 总是成立,因此 ,特别地,零空间永远不会是空。

  • 的子空间,而 的子空间

  • 当且仅当 为单射的 (一对一)

备注 :零空间与列空间

考虑 以及线性映射

对于 的列,我们可以得到

即:像是 的列的张成空间,也成为 列空间(column space) 。因此,列空间(像)是 的子空间,其中是矩阵的“高度”。

  • 核/零空间是齐次线性方程组 的通解,即使得 的列的线性组合为 中的元素

  • 核是的子空间,其中是矩阵的“宽度”。

  • 核关注列之间的关系,我们可以使用它来确定是否/如何将列表示为其他列的线性组合

线性映射的像和核

映射:

是线性的。为了确定 ,我们可以取变换矩阵列的生成空间(span),得到

为了计算 的核(零空间),我们需要解 ,也就是说,我们需要解一个齐次方程组。为此,使用高斯消元法将转化为行最简阶梯型:

这个矩阵是行最简阶梯型,我们可以使用之前提到的 Minus-1 技巧来计算核的基本。或者,我们将非主元列 (第3列和第4列)表示为主元列(第1列和第2列)的线性组合。第三列 相当于第二列倍数。因此, 。以同样的方式,我们看到 ,因此 。总的来说,可以得到核(零空间)为

定理2.24 秩-零化度定理

对于向量空间 和线性映射 ,总有

秩-零化度定理(Rank-Nullity Theorem) 也被称为 线性映射的基本理论(fundamental theorem of linear mappings ,下面是通过该定理得到的结论:

  • 如果 , 那么 是非平凡的,即核不仅包含 ,且

  • 如果 相对于有序基的变换矩阵, 且 ,则线性方程组 有无穷多个解。

  • 如果 ,则以下三个说法等价

    • 是单射的

    • 是满射的

    • 是双射的 因为

27 January 2026