Linear Transformation

研究向量空间上结构不变的映射，这允许我们定义坐标的概念。之前我们说过向量相加并乘以标量得到的对象仍然是一个向量。这里我们希望在应用映射时保留此特性：

考虑两个实数向量空间, 。对于和 ,映射保持向量空间结构不变需满足：

可以用定义来概括

定义线性映射

对于向量空间，，如果

则称为线性映射(Linear Mapping) ，或向量空间同态(vector space homomorphism) 或线性变换(linear transformation)

这使得我们可以把线性映射用矩阵表示。之前的内容：将向量集合用矩阵的列表示。在处理矩阵的时候，我们必须判断矩阵所表示的内容：是线性映射还是向量集合。后面会看到关于更多的线性映射的内容，介绍一些特殊映射

定义单射，满射，双射

考虑一个映射，其中，是任意集合。那么可以是

单射的(Injective):
满射的(Surjective):
双射的(Bijective): 既是单射的，也是满射的

如果是满射的，那么中的每个元素都可以通过从 “到达”。单射意味着映射结果相同的元素为同一元素。双射既是单射的也是满射的，所以一个双射映射可以“撤销”（双射映射意味着两个空间的个体是一一对应的，所以可以撤销；而非双射这种多对一的情况，“撤销”后的对象是不唯一，不确定是哪一个，所以无法撤销。）即存在一个映射，使得。映射被称为的逆，通常用表示。

在这些定义下，介绍一些向量空间和之间线性映射的特殊情况

同态(Homomorphism)：线性
同构(Isomorphism)：双射
自同态(Endomorphism)：线性
自同构(Automorphism)：双射
定义：为中的恒等映射或单位自同构(identity mapping or identity automorphism)

例同态

$，$ 是同态映射。

这也证明了为什么复数可以在中表示为元组：有一个双射线性映射，它将中的元组的元素加法转换为具有相应加法的复数集。注意，这里我们只展示了线性，而没有双射。

定理2.17

有限维向量空间和同构当且仅当

定理2.17指出在两个相同维度的向量空间之前存在一个线性的双射映射。直觉上，意味着相同维度的向量空间是相同的，它们可以相互转化而不产生任何误差。

定理2.17也给出了之前将（-矩阵张成的向量空间）和 ( 的向量张成的向量空间)视为相同的理由：因为它们的维数都是，所以存在一个线性双射映射，将它们互相转换。（注意：向量空间的维数，由向量张成的向量空间的维数，以及由矩阵张成的向量空间的维数的区别）

备注

考虑向量空间

对于线性映射和，那么也是线性映射。
如果同构，那么也是同构的。
如果都是线性的（同态的），那么和也是线性的（同态的）。

线性映射的矩阵表示

任何维向量空间同构于（定理2.17）。我们考虑维向量的空间的一个基。在下文中，基向量的顺序很重要。我们对集进行排序，得到

并称这个元组为的有序基(ordered basis)

备注：基需要是有序的，所谓的“第一个坐标，第二个坐标，等”才是有意义的

备注：目前为止定义的符号有点多，在这里总结以下

为有序基
为（无序的）基
是列为的矩阵

定义坐标

考虑一个向量空间以及的一个有序基。对于任意的，有唯一一个关于的线性组合

称为: 关于的坐标(Coordinates)

为相对于有序基的坐标向量/ 坐标表示(coordinate vector/ coordinate representation)

一个基有效定义了一个坐标系。我们熟悉的笛卡尔坐标系，它由标准基向量构成。在这个坐标系中，向量都可以表示为的线性组合。然而，的任何基都定义了一个有效的坐标系，同一个向量在基中可能会与不同的坐标表示。

在图2.8中, 相对于标准基的坐标为。然而，关于基，相同的向量被表示为，即。在下文中了解如果获得这种表示。

例

几何向量相对于的标准基的坐标为。可以将其表示为。但是不一定选择标准基来表示这个向量。可以选择为基向量，这样可以得到相对它们的坐标：

图中的不同坐标表示取决于不同的基

备注

对于一个维向量空间和的一个有序基，映射 $，$ 是线性的( 维度相同，所以进一步是同构的)，其中是关于的标准基。

现在我们准备在矩阵和有限维向量空间之间的线性映射建立一个显示联系

定义2.19 变换矩阵

考虑向量空间和以及相应的有序基和。再考虑线性映射：

表示经过变换后相对的唯一坐标表示。然后我们得到

我们称矩阵为（关于的有序基和的有序基）的* 变换矩阵(transformation matrix)*

相对于的有序基的坐标是矩阵的第列。

考虑(有限维) 向量空间、及其对应的有序基、和变换矩阵。

如果是相对于的坐标向量。是相对于的坐标向量，则

这意味着可以使用变换矩阵将相对于的有序基的坐标映射到相对于中有序基的坐标。

例变换矩阵

考虑同态映射以及的有序基和的有序基并由:

可得关于和满足的变换矩阵为

其中为相对于的坐标向量

例向量的线性变换

图2.10 向量线性变化的三个例子

(a) 初始数据
(b) 旋转45°
(c) 水平坐标拉伸
(d) 反射、旋转和拉升的组合

考虑中的一组向量的三个线性变换及其变换矩阵

图2.10给出了一组向量线性变换的三个例子。图（a) 显示了中的400个向量，每个向量对应 -坐标的一个点。向量排列成正方形。

当我们矩阵使用对这些向量进行线性变换时，我们得到了（b）中被旋转的正方形。

如果表示的线性映射，我们得到（c）中的矩形，其中每个坐标被拉伸2倍。

（d）显示了对原始图形使用线性变换后的图形，是反射、旋转和拉伸的组合。

基变换

接下来，我们观察下当改变和的基时，线性映射是怎样变化的。

考虑的两个有序基(ordered basis)

和的两个有序基(ordered basis)

是关于基和的映射的变换矩阵。

是关于基和的映射的另一个变换矩阵。

下面我们研究需要研究和是什么关系，

即：如果我们选择从基到基进行基变换，我们是否可以或如何将变换成

备注

向量的坐标表示，取决于基(basis)的选择。在图2.9中我们经过恒等映射得到向量不同的坐标表示。这意味着，在不改变向量的情况下，将它相对于的坐标映射到相对于的坐标上。通过改变基，从而改变向量的表示，这允许通过一个简单的变换矩阵直接计算实现。

例基变换的必要性

考虑一个关于标准基的变换矩阵

如果我们定义一个新基：

可以得到一个关于的对角变换矩阵

它比更容易处理。

在下面，我们将研究将一个基的坐标向量转换成另一个基的坐标向量的映射。我们首先陈述主要结论，然后给出解释。

定理2.20 基变换

对于线性映射，的有序基

和的有序基

以及是关于和的映射的变换矩阵。是关于和相应的变换矩阵，它由以下公式给出：

其中，为的变换矩阵，它将相对于的坐标映射到。而为的变换矩阵，它将相对于的坐标映射到

证明

把的新基的向量写成的基向量的线性组合：

同理，把的新基的向量写成的基向量的线性组合：

我们定义

为将相对于的坐标映射到的变换矩阵
是将相对于的坐标映射到的变换矩阵

特别地，的第列是相对于的坐标，而的第利是相对于的坐标表示。注意和都是正则的（可逆的）

我们将从两个角度来看

第一，通过映射，对于，我们可以得到

我们首先将新的基向量表示为基向量的线性组合，然后交换求和顺序。

或者，利用的线性，把表示为的线性组合，可以得到

比较和的两个式子，得出对于所有和 ,有:

所以

则：

证毕。

定理2.20 告诉我们，对于（变换为）和（变换为）的基变换，线性映射的变换矩阵与等价矩阵替换关系为：

图2.11 对于一个同态映射和的有序基以及的有序基 (用蓝色标记)，我们可以把相对于的映射等价地表示为同态映射的组合，其中各个符号的下标为该符号对应的基变换对象。相应的变换矩阵用红色表示。

图2.11 说明了这种关系：考虑一个同态映射和的有序基以及的有序基。映射是的一个实例，它将的基向量映射为的基向量的线性组合。

假设我们已知关于有序基, 的的变换矩阵。当我们在中到和中到间执行基变换时，我们可以通过以下步骤得到相应的变换矩阵

首先，我们找到了线性映射的矩阵表示，它将相对于新基的坐标映射到相对"旧"基（在中）的（唯一）坐标上。

然后，我们使用的变换矩阵将这些坐标映射到相对于中的基的坐标上。

最后，我们使用线性映射将相对于的坐标映射到相对于的坐标上。

因此，我们可以把线性映射表示为包含"旧"基的线性映射的组合：

具体的说，我们使用和，即将向量恒等映射到自身所在的向量空间，单相对于不同的基。

定义2.21 等价

如果存在正则矩阵和，使得，则称两矩阵等价(Equivalence)

定义2.22 相似

如果存在正则矩阵使得，则称两矩阵相似(Similarity)

备注：

相似矩阵总是等价的。然而，等价矩阵不一定相似。

备注：

考虑向量空间, , 。从定理2.17后面的备注中，我们已经知道，对于线性映射和 ,映射也是线性的。若这两个映射相应的变换矩阵为和，则整个变换矩阵是。

鉴于此，我们可以从构建线性映射的角度来看待基的变化：

为关于基，的线性映射的变换矩阵
为关于基，的线性映射的变换矩阵
是线性映射（自同构）的变换矩阵，它用表示。通常，是中的恒等映射。
是线性映射（自同构）的变换矩阵，它用表示。通常，是中的恒等映射。

如果我们（非正式地）用基的形式表示变换，那么有:

以及

注意，(2.116)中的执行顺序是从右向左的，因为向量是在右侧相乘，即

例基变换

考虑一个线性映射的变换矩阵为：

变换相应的标准基为：

我们求关于新基

的变换矩阵，首先求出：

式中，的第列是相对于的基向量的坐标表示。对于一般的基，我们需要解一个线性方程组来求，使得。类似地，的第列是相对于的基向量的坐标表示。

因此，我们可以得到

在第四章中，我们将利用基变换的概念来寻找一个基，使得自同态的变换矩阵有一个特别简单的（对角）形式。

在第十找章降维中，我们将利用基变换研究一个数据压缩问题，即找到一个基并在这个基上投影数据从而压缩数据，同时最小化压缩损失。

像与核

线性映射的像和核是具有某些重要性质的向量子空间。在下面，我们将详细地描述它们。

定义23像与核(Image and Kernal)

对于，我们定义 **核/零空间(e kernel / null space)**为:

以及像/值域(image / range) 为：

原书籍中是可能有误

我们也分别称和为的定义域(domain) 和陪域(codomain) 或称为上域、到达域

直观的说，核是被映射到单位元上的一组向量

像是一组向量，中任何向量都能被映射"到达" 像。如图2.12所示

图2.12 线性映射的核与像

备注

考虑线性映射，其中和为向量空间

当总是成立，因此，特别地，零空间永远不会是空。
是的子空间，而是的子空间
当且仅当，为单射的（一对一）

备注：零空间与列空间

考虑以及线性映射

对于，为的列，我们可以得到

即：像是的列的张成空间，也成为列空间(column space) 。因此，列空间（像）是的子空间，其中是矩阵的“高度”。

核/零空间是齐次线性方程组的通解，即使得的列的线性组合为和中的元素
核是的子空间，其中是矩阵的“宽度”。
核关注列之间的关系，我们可以使用它来确定是否/如何将列表示为其他列的线性组合

例线性映射的像和核

映射:

是线性的。为了确定，我们可以取变换矩阵列的生成空间(span)，得到

为了计算的核（零空间），我们需要解，也就是说，我们需要解一个齐次方程组。为此，使用高斯消元法将转化为行最简阶梯型：

这个矩阵是行最简阶梯型，我们可以使用之前提到的 Minus-1 技巧来计算核的基本。或者，我们将非主元列（第3列和第4列）表示为主元列（第1列和第2列）的线性组合。第三列相当于第二列的倍数。因此，。以同样的方式，我们看到，因此。总的来说，可以得到核（零空间）为

定理2.24 秩-零化度定理

对于向量空间，和线性映射，总有

秩-零化度定理(Rank-Nullity Theorem) 也被称为线性映射的基本理论（fundamental theorem of linear mappings ，下面是通过该定理得到的结论：

如果，那么是非平凡的，即核不仅包含，且
如果是相对于有序基的变换矩阵，且，则线性方程组有无穷多个解。
如果，则以下三个说法等价
- 是单射的
- 是满射的
- 是双射的因为

27 January 2026