浅谈矩阵和矩阵乘法的由来（上）

YourMath 2017-11-02 12:41

前言：

曾经偶然在网上发现一篇讲解矩阵乘法的文章，初看之时被文章中关于矩阵乘法的规则搞得晕头转向，但是多亏其讲解，我在某种程度上理解了矩阵乘法的本质。结合自己的理解而作本文，希望有更多人了解矩阵乘法规则的来源。

（部分内容与原文相仿，因为时间关系也搬了一些图，见谅。）

“

学习线性代数，我们必然要接触矩阵这一重要的概念。翻一翻教材，矩阵几乎贯穿了整本书，但是仔细一看，书上全是五花八门的矩阵及其五花八门的性质，令人头晕目眩。相信很多人即使看完了一本教材，被问到矩阵到底是什么时也得哑口无言。今天我们就来讲一讲，这奇葩的玩意究竟是怎么来的

”

据我所知，矩阵在创造之初其实只是作为一种方程组简写的方式。俗话说得好，懒是一切发明创造的原动力。

（谁说的？不要在意这些细节。）

因为懒得走路，人们发明了交通工具；因为懒得打草稿，发明了计算机；同样的，因为懒得写方程组，矩阵出现了

（为了便于表达，本文直接使用了矩阵的概念）

上面的方程组，写起来很麻烦，可以简写成：

●确实，有同学就看出来了，这不就是按照矩阵乘法的规则写的吗？

●但是我们先装作什么都不知道，这个形式唯一的意义就是：作为方程组的简写。

所以说，即使我把含有未知量的矩阵写成行矩阵是完全没有问题的，不过这样的话引申出来的矩阵乘法的规则也会随之变化。

▲为什么偏偏简写成这个样子？

▼正是因为某人随手简写成这个样子，矩阵甚至线性代数才会发展成现在的这个样子，你要是能穿越回去换个方式简写，说不定会改变整个线性代数的表达方式。这里只是模仿了历史写法而已。

好，现在我们有了一个简写规则了，把方程组写成上述形式，

等号左边是一个常数矩阵和一个未知量矩阵，右边是一个常数矩阵。

也就是说我们通过把方程组写成这样来节约时间和墨水

★这里需要注意！

我并没有说左边两个矩阵之间有任何关系

或者说

这两个矩阵的关系仅仅是并排摆在了一起！

如果先入为主地认为左边两个矩阵相乘得到右边，（那我还怎么往下编）那就是在胡说八道了，要知道我们现在仅仅是定义了一个简写方式而已

好了，方程组也简写了，墨水也省下来了，接下来我们试试用这种简写解个方程组：

▲这里我们为什么猝不及防地使用了增广矩阵来简写呢？

▼因为解方程势必涉及未知量的系数和常数项，我们要省略的只有未知量而已。这也是一种简写方式罢了。过程中的每一个矩阵都是方程组的一种形式，化简矩阵的过程就是化简方程组的过程，最后得到一个简单的方程组，直接计算出答案。矩阵本来就只有这么点作用（省墨水）罢了

咳咳，如果不是一群数学家前赴后继地探索发现它的更多用途的话… …

所以如果想要理解矩阵，我们得先装作根本不了解矩阵。具体来说，就是忘记什么可逆转置矩阵的秩之类的东西，把上述过程看成一般的解方程组的过程，矩阵的作用仅仅是作为简写符号。

现在我们都是矩阵的创始人了，让我们一起继续创造矩阵

▲矩阵乘法又是什么鬼？？？

▲简写符号怎么会有自己的运算规则？？？

（本文之后的图片均来自前言所说的原文）

我们先来看这样的一个问题：

已知，有三组未知数x，y，t，其中x和y的关系如下：

而x和t也满足一个关系：

那么问题来了（挖掘机技术哪家强？呸呸呸！）

现在y和t满足的是什么关系？

“

（有人说我只是在故弄玄虚，试图用一堆莫名其妙的未知量搞一个大新闻。其实这个问题非常现实）

★举个例子，平面直角坐标系有一条直线3x+4y=5。而且我们知道极坐标系中ρ和θ与直角坐标系中x和y的关系。

那我问问你：

极坐标系下这条直线的方程该怎么写？

或者说，怎么用ρ和θ表示这条直线？

答案是显然的。

▲ x=ρ*cosθ,y=ρ*sinθ，这四个未知量之间并不是线性关系啊？怎么能用线性方程的形式表达呢？

▼这里只是为了便于大家理解以直线和极坐标系为例子。事实上如果有其他坐标系的未知量m，n分别和x，y成线性关系，问题就会变成如何利用m，n中表达x和y，本质没有变化（利用中间变量求两个变量之间的关系），只是更抽象罢了。

”

P.S：【小编有话讲】想要深入了解矩阵和坐标转换之间有什么关系？不妨回想一下，在学习微积分的时候，我们知道了，坐标系的转换过程会用到一个叫做雅克比行列式的东西，它是什么东西？又是如何推导出来的呢？它和矩阵有关系吗？

这些都有待我们去思考，和学习。

所以很多人到了大学反而会感觉，我们所学的，真的只是皮毛而已。

好了，那么我们回归问题，怎么求y和t的关系？

显然，我们把x和t的关系式直接带入x和y的关系式中：

稍作整理，得到y和t的关系式：

●你们不用说了，我也是眼花缭乱，生无可恋了

这个式子看起来确实烦人，大家也不必仔细观察分析了，这个只是简单的代换罢了

下面重点来了！（敲黑板！！！）

利用之前省墨水的方式简写已知的两个方程组：

●还是要提醒一下：

目前这个式子只是作为简写式，其唯一的数学意义就是左边的部分等于右边的部分，

换句话说除了等号其他的一切都是我们自创的，没有被认可

▲那我要它有什么用？？？

▼等等… …

我刚刚说了什么？

左边的部分等于右边的部分！

这里等号的意义是大家公认的，可是一个等号能做什么用呢？

等量代换！！！

没错！右边一个括号加未知量x1和x2这个别人根本不认识而我们叫做矩阵的东西，在上下两个方程组里面都出现了，我们可以直接代换，更严格地说，是取代其位置，因为我们还没有定义任何运算规则。

得到下面这个东西：

慢着，别激动也别着急，事态突然紧急了起来！因为按照我们最初的想法，等号左边只有：一个常数矩阵和一个未知量矩阵。现在这样的写法显然是不符合我们的简写规则的，还记得我们怎么简化方程组的吗？

等号左边是一个常数矩阵和一个未知量矩阵，右边是一个常数矩阵

▲怎么办呢？

▼其实这个时候我们就可以定义运算规则了：

对于左边的部分，很显然最右边是未知量矩阵，问题在于左边的两个常数矩阵无法处理

小编：这有什么难的，把两个变成一个呗。

我们来定义一种运算：

当两个矩阵并排放置的时候，他们就等于一个矩阵。

重复一遍：

两个矩阵并排放在一起的时候，就可以用一个矩阵来表示（代替）

小编一脸嘚瑟jpg..诶等等，是不是少了什么

运算规则呢？？？

▲我们该用什么矩阵来代替这两个矩阵呢？

▲我们为什么定义矩阵，定义简写规则，甚至定义了运算？

▼是为了求y和t的关系式！

▼还记得那串让人眼花缭乱的结果吗？

要不要试试把它简写一下？

上面是我们按照简写规则得到的答案。

这个是我们尝试代换之后的结果… …

●小编：还用我说什么吗？（斜眼笑）

我们把这个定义为矩阵乘法

这是属于我们的创造

我们定义了矩阵，定义了简写规则，定义了矩阵的乘法

（当然，只是粗略地定义了两个常数矩阵的乘法）

【小编有话讲】

但是，正是由于数学家们前赴后继地重复并且深入地做着我们之前所做的工作，线性代数的体系慢慢建立了起来。什么？你问这个体系有什么用？之前所说的直线的坐标转换就是一个很常见的例子，时至今日线性代数作为基础学科，我只能说它已然变成人类科技大厦的一块稳固的地基了。

你以为这就结束了？

本文似乎漏洞百出而且极其随意的证明看起来完全不能让人信服，虽然它可能就是当时数学家们的想法，当然我们也不需要严谨地证明什么。下一篇推送将利用本篇所得的结论来验证一下矩阵乘法的性质，让这篇文章更有说服力，同时也会告诉你们：

（其实这一切都是我胡编的）其实矩阵乘法不只是乘法… …

参考文献：

http://www.ruanyifeng.com/blog/2015/09/matrix-multiplication.html

供稿：北京理工大学李修远

编辑：北京理工大学刘梦真

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。