矩阵与线性变换-白红宇

矩阵与线性变换

阅读量：5156 次

发布时间：2019-06-13

本文共 5401 字，大约阅读时间需要 18 分钟。

一般来说，方阵能描述任意线性变换。线性变换保留了直线和平行线，但原点没有移动。线性变换保留直线的同时，其他的几何性质如长度、角度、面积和体积可能被变换改变了。从非技术意义上说，线性变换可能“拉伸”坐标系，但不会“弯曲”或“卷折”坐标系。

矩阵是怎样变换向量的

向量在几何上能被解释成一系列与轴平行的位移，一般来说，任意向量v都能写成“扩展”形式：

另一种略有差别的形式为：

注意右边的单位向量就是x，y，z轴，这里只是将概念数学化，向量的每个坐标都表明了平行于相应坐标轴的有向位移。

让我们将上面的向量和重写一遍，这次分别将p、q、r定义为指向+x，+y和+z方向的单位向量，如下所示：

v = xp + yq + zr

现在，向量v就被表示成向量p，q，r的线性变换了，向量p，q，r称作基向量。这里基向量是笛卡尔坐标轴，但事实上，一个坐标系能用任意3个基向量定义，当然这三个基向量要线性无关（也就是不在同一平面上）。以p、q、r为行构建一个3 x 3矩阵M，可得到如下矩阵：

用一个向量乘以该矩阵，得到：

如果把矩阵的行解释为坐标系的基向量，那么乘以该矩阵就相当于执行了一次坐标转换，如果aM=b，我们就可以说，M将a转换到b。

从这点看，术语“转换”和“乘法”是等价的。

坦率地说，矩阵并不神秘，它只是用一种紧凑的方式来表达坐标转换所需的数学运算。进一步，用线性代数操作矩阵，是一种进行简单转换或导出更复杂转换的简便方法。

矩阵的形式：

基向量[1, 0, 0], [0, 1, 0], [0, 0, 1]乘以任意矩阵M：

用基向量[1, 0, 0]乘以M时，结果是M的第1行。其他两行也有同样的结果，这是一个关键的发现：矩阵的每一行都能解释为转换后的基向量。

这个强有力的概念有两条重要性质：

1、有了一种简单的方法来形象化解释矩阵所代表的变换。

2、有了反向建立矩阵的可能 ---- 给出一个期望的变换（如旋转、缩放等），能够构造一个矩阵代表此变换。我们所要做的一切就是计算基向量的变换，然后将变换后的基向量填入矩阵。

首先来看看2D例子，一个2 x 2矩阵：

这个矩阵代表的变换是什么？首先，从矩阵中抽出基向量p和q：

p = [2 1]

q = [-1 2]

图7.1以“原”基向量（x轴，y轴）为参考，在笛卡尔平面中展示了这些向量。

、

如图7.1所示，x基向量变换至上面的p向量，y基向量变换至q向量。所以2D中想象矩阵的方法就是想象由行向量构成的“L”形状。这个例子中，能够很清楚的看到，M代表的部分变换是逆时针旋转26度。

当然，所有向量都被线性变换所影响，不只是基向量，从“L”形状能够得到变换最直观的印象，把基向量构成的整个2D平行四边形画完整有助于进一步看到变换对其他向量的影响，如图7.2所示：

平行四边形称作“偏转盒”，在盒子中画一个物体有助于理解，如图 7.3 所示：

很明显，矩阵M不仅旋转坐标系，还会拉伸它。

这种技术也能应用到3D转换中。2D中有两个基向量，构成"L"型；3D中有三个基向量，它们形成一个”三脚架“。首先，让我们展示出一个转换前的物品。图7.4展示了一个茶壶，一个立方体。基向量在”单位“向量处。

（为了不使图形混乱，没有标出z轴基向量[0, 0, 1]，它被茶壶和立方体挡住了。）

现在，考虑以下3D变换矩阵：

从矩阵的行中抽出基向量，能想象出该矩阵所代表的变换。变换后的基向量、立方体、茶壶如图7.5所示：

这个变换包含z轴顺时针旋转45度和不规则缩放，使得茶壶比以前”高“。注意，变换并没有影响到z轴，因为矩阵的第三行是[0, 0 , 1]。

我们可以通过让比例因子k按比例放大或缩小来缩放物体。如果在各方向应用同比例的缩放，并且沿原点“膨胀”物体，那么就是均匀缩放。均匀缩放可以保持物体的角度和比例不变。如果长度增加或减小因子k，则面积增加或减小k^2。在3D中，体积将增加或减小 k^3。

如果需要“挤压”或"拉伸"物体，在不同的方向应用不同的因子即可，这称作非均匀缩放。非均匀缩放时，物体角度将发生变化。视各方向缩放因子的不同，长度、面积、体积的变化因子也各不相同。

如果|k|<1，物体将“变短”；如果|k|>1，物体将“变长”，如果k = 0，就是正交投影，如果k < 0就是镜像。

应用非均匀缩放的效果类似于切变，事实上，非均匀缩放和切变和很难区分的。

沿坐标轴的缩放

最简单的缩放方法是沿着每个坐标轴应用单独的缩放因子，缩放是沿着垂直的轴（2D中）或平面（3D中）进行的。如果每个轴的缩放因子相同，就是均匀缩放，否则是非均匀缩放。

2D中有两个不同的缩放因子，Kx和Ky，图8.13展示了应用不同缩放因子后的情况。

凭直觉就可知道，基向量p，q由相应的缩放因子单独影响：

p' = Kxp = Kx [1 0] = [Kx 0]

q' = Kyq = Ky [0 1] = [0 Ky]

用基向量构造矩阵，结果如公式8.6所示：

对于3D，需要增加第三个缩放因子Kz，3D缩放矩阵如公式8.7所示：

沿任意方向缩放

我们可以不依赖于坐标系而沿任意方向进行缩放，设n为平行于缩放方向的单位向量，k为缩放因子，缩放沿穿过原点并平行于n的直线（2D中）或平面（3D中）进行。

我们需要推导出一个表达式，给定向量v，可以通过v，n和k来计算v'。为了做到这一点，将v分解为两个分量，v||和v⊥，分别平行于n和垂直于n，并满足v =v|| + v⊥。v||是v在n上的投影，由 (v . n)n 可以得到 v||。因为v⊥垂直于n，它不会被缩放操作影响。因此，v' = v||' + v⊥，剩下的问题就是怎样得到v||'。由于v||平行于缩放方向，v||'可以由公式kv||得出，如图8.14所示：

总结已知向量并进行代换，得到：

既然我们知道了怎样对任意向量进行缩放，当然也就可以计算缩放后的基向量。这里只详细列出2D中的一个基向量的求法，其余的基向量依次类推。我们只给出其结果（注意下面采用列向量形式只是为了使等式的形式好看一些。）

通过基向量构造矩阵，得到以单位向量n为缩放方向，k为因子的缩放矩阵，如公式8.8所示：

3D中，基向量为：

以单位向量n为缩放方向，k为因子的3D缩放矩阵如公式8.9所示：

一般来说，投影意味着降维操作，有一种投影方法是在某个方向上用0作为缩放因子。这种情况下，所有点都被拉平至垂直的轴（2D）或平面（3D）上。这种类型的投影称作正交投影（或者平行投影），因为从原来的点到投影点的直线相互平行。

向坐标轴或平面投影

最简单的投影方式是向坐标轴（2D）或平面（3D）投影，如图8.15所示：

向坐标轴或平面投影在实际变换中不常发生，大多数情况是向低维的变换赋值，且要抛弃维数时。例如，将3D点赋值给2D点，抛弃z分量，只复制x和y。

通过使垂直方向上的缩放因子为零，就能向坐标轴或平面投影。考虑到完整性，下面列出这些变换矩阵，见公式8.10 - 8.14。

向任意直线或平面投影

也能向任意直线或平面投影，像往常一样，由于不考虑平移，这些直线或平面必须通过原点。投影由垂直于直线或平面的单位向量n定义。

通过使该方向的缩放因子为0能够导出向任意方向投影的矩阵，2D中的情况如公式8.15所示：

记住这里n垂直于投影直线，而不是平行。3D中，向垂直于n的平面投影的矩阵如公式8.16所示：

镜像

镜像（也叫做反射）是一种变换，其作用是将物体沿直线（2D中）或平面（3D中）“翻折”，图8.16展示了镜像的效果。

使缩放因子为-1能够很容易地实现镜像变换，设n为2D单位向量，公式8.17所示的矩阵将沿通过原点且垂直于n的反射轴来进行镜像变换。

3D中，用反射平面代替直线。公式8.18中的矩阵将沿通过原点且垂直于n的平面来进行镜像变换：

注意一个物体只能“镜像”一次，如果再次镜像（当沿不同的轴或平面的时候），物体将翻回“正面”（用一张纸来想象），这和在原位置旋转物体的效果一样。

切变

切变是一种坐标系“扭曲”变换，非均匀地拉伸它。切变的时候角度会发生变化，但令人惊奇的是面积和体积却保持不变。基本思想是将某一坐标的乘积加到另一个上。例如，2D中将y乘以某个因子然后加到x上，得到 x' = x + sy，如图8.17所示：

实现这个切变变换的矩阵为：

变换的组合

设想世界中有一个任意方向、任意位置的物体，我们要把它渲染到任意方向、任意位置的摄像机中。为了做到这一点，必须将物体的所有顶点从物体坐标系变换到世界坐标系，接着再从世界坐标系变换到摄像机坐标系。其中的数学变换总结如下：

矩阵乘法满足结合律，所以我们能用一个矩阵直接从物体坐标系变换到摄像机坐标系：

这样就能在渲染的循环外先将所有矩阵组合起来，使循环内作矩阵乘法的时候只需要和一个矩阵相乘即可（物体有很多顶点，省一次矩阵乘法就会提高不少效率），如下:

所以矩阵组合从代数角度看是利用了矩阵乘法的结合律。矩阵的行向量就是变换后的基向量，这在多个变换的情况下也是成立的。考虑矩阵乘法AB，结果中的每一行都是A中相应的行与矩阵B相乘的结果。换言之，设a1, a2, a3为A的行，矩阵乘法能够写为：

这使得结论更加清晰，AB结果中的行向量确实是对A的基向量进行B变换的结果。

变换分类

变换的类别并不是互斥的，也不存在一定的“次序”或“层次”使得某一类比另一类多或少一些限制。

当讨论一般意义上的变换时，我们将使用类似的术语：映射或函数。在最一般的意义上，映射就是一种简单的规则，接受输入，产生输出。我们把从a到b的F映射记作F(a) = b。

线性变换

在数学上，如果满足下式，那么映射F(a)就是线性的：

F(a + b) = F(a) + F(b) 以及 F(ka) = kF(a)

如果映射F保持了基本运算：加法和数量乘，那么就可以称该映射为线性的。在这种情况下，将两个向量相加然后再进行变换得到的结果和先分别进行变换再将变换后的向量相加得到的结果相同。同样，将一个向量数量乘再进行变换和先进行变换再数量乘的结果也是一样的。

这个线性变换的定义有两条重要的引理：

(1) 映射F(a) = aM，当M为任意方阵时，说映是一个线性变换，这是因为：

F(a + b) = (a + b)M = aM + bM = F(a) + F(b)

和

F(ka) = (ka)M = k(aM) = kF(a)

(2) 零向量的任意线性变换的结果仍然是零向量。（如果F(0) = a，a ≠ 0。那么F不可能是线性变换。因为F(k0) =a，但F(k0) ≠ kF(0)），因此线性变换不会导致平移（原点位置上不会变化）。

在某些文献中，线性变换的定义是平行线变换后仍然是平行线。大多数情况下它是对的，但有一个小小的例外：投影（当一条直线投影后变成一个点，能认为这个点平行于什么？）除了这点理论上的例外，这种定义是正确的。线性变换可能造成“拉伸”，但直线不会”弯折“，所以平行线仍然保持平行。

仿射变换

仿射变换是指线性变换后接着平移。因此仿射变换的集合是线性变换的超集，任何线性变换都是仿射变换，但不是所有仿射变换都是线性变换。

任何具有形式 v' = vM + b 的变换都是仿射变换。

可逆变换

如果存在一个逆变换可以”撤销“原变换，那么该变换是可逆的。换句话说，如果存在逆变换G，使得G(F(a)) = a，对于任意a，映射F(a)是可逆的。

存在非仿射变换的可逆变换，但暂不考虑它们。现在，我们集中精力于检测一个仿射变换是否可逆。一个仿射变换就是一个线性变换加上平移，显然，可以用相反的量”撤销“平移部分，所以问题变为一个线性变换是否可逆。

显然，除了投影以外，其他变换都能”撤销“。当物体被投影时，某一维有用的信息被抛弃了，而这些信息时不可能恢复的。因此，所有基本变换除了投影都是可逆的。

因为任意线性变换都能表达为矩阵，所以求逆变换等价于求矩阵的逆。如果矩阵是奇异的，则变换不可逆；可逆矩阵的行列式不为0。

等角变换

如果变换前后两向量夹角的大小和方向都不改变，该变换是等角的。只有平移，旋转和均匀缩放是等角变换。等角变换将会保持比例不变，镜像并不是等角变换，因为尽管两向量夹角的大小不变，但夹角的方向改变了。所有等角变换都是仿射和可逆的。

正交变换

术语“正交”用来描述具有某种性质的矩阵。正交变换的基本思想是轴保持互相垂直，而且不进行缩放变换。

平移、旋转和镜像是仅有的正交变换。长度、角度、面积和体积都保持不变。（尽管如此，但因为镜像变换被认为是正交变换，所以一定要密切注意角度、面积和体积的准确定义）。

正交矩阵的行列式为1或者负1，所有正交矩阵都是仿射和可逆的。

刚体变换

刚体变换只改变物体的位置和方向，不包括形状。所有长度、角度、面积和体积都不变。平移和旋转是仅有的刚体变换，镜像并不被认为是刚体变换。刚体变换也被称作正规变换，所有刚体变换都是正交、等角、可逆和仿射的，某些刚体变换旋转矩阵的行列式为1。

转载于:https://www.cnblogs.com/awishfullyway/p/6068452.html

你可能感兴趣的文章

jQuery - 控制元素显示、隐藏、切换、滑动的方法

查看>>

postgresql学习文档

查看>>

Struts2返回JSON数据的具体应用范例

Xamarin Visual Studio不识别JDK路径

windows下的C++ socket服务器（4）

查看>>