博客日记

矩阵的故事


摘要:简介「矩阵」观念的发生,说明其英文字的缘由,阐述矩阵相乘的意涵。

数学史大约已经认定英国数学家凯莱(Arthur Cayley, 1821-95)是开创矩阵理论的人。凯莱本人却在文章中指出矩阵之观念由来已久,而且「matrix」这个字是席维斯(James Sylvester, 1814-97)建议的。正如现在大家所知,矩阵是以矩形排列的一组数。虽说是「矩」阵,但早期的数学家其实仅讨论「正方形」矩阵,也就是 \(n\times{n}\) 矩阵或 \(n\) 阶方阵,简称方阵。

方阵之概念,自从克拉玛在1750年引入行列式之后,就跟着进入西欧的数学圈了。即使数学家早就有必要区分用来计算行列式的那 \(n^2\) 个数以及行列式本身,却长期没这幺做。直到席维斯觉得不分开这两个观念实在不舒服,他用了 matrix 表示计算行列式的那 \(n^2\) 个数。Matrix 这个字有「母体、基础」的意思,畅销的电影『骇客任务』的英文片名就是『Matrix』。席维斯可能意指 matrix 是行列式的「母体、基础」。

凯莱先在 1855 年研究不变量的论文里简略定义了方阵观念,用它处理不变量的计算。然后在 1858 年发表了一篇 24 页的论文〈A Memoir on the Theory of Matrices〉(矩阵理论纪要),涵盖所有初学者该知道的方阵知识,包括方阵的特徵多项式、特徵值及所谓的「汉弥尔顿—凯莱定理」。(高中读者暂时不必理会「特徵多项式」是什幺,无非就是一个特殊的多项式。)

「汉弥尔顿—凯莱定理」是说:令 \(p(x)\) 是方阵 \(A\) 的特徵多项式,则 \(p(A)=O\),其中 \(O\) 是与 \(A\) 同阶的零方阵。这其实是凯莱提出的定理,之所以在文章里提到汉弥尔顿,是因为他在听汉弥尔顿的四元数课程时,被启发了这个想法。但是凯莱在文章中只证明了 \(A\) 是 \(3\) 阶方阵的情况,完整的证明是弗洛毕伍斯(Ferdinand Frobenius, 1849-1917)在二十年后完成的。但是弗洛毕伍斯仍然慷慨地称此定理为「汉弥尔顿—凯莱定理」。

凯莱曾经指出他研究方阵的动机并非来自于四元数,而是为了简化「线性变换」\(\left\{\begin{array}{ll}x’=a_{11}x+a_{12}y\\y’=a_{21}x+a_{22}y\end{array}\right.\) 的描述和书写。前面这个看起来很像二元一次联立方程式的式子,其意义是把平面上的点 \((x,y)\)「变换」成另一个点 \((x’,y’)\)。令 \(A=\left [\begin{array}{cc}a_{11} & a_{12} \\a_{21} & a_{22}\end{array}\right ]\) 凯莱将上述线性变换简记成 \(A\),我们也说 \(A\) 是线性变换的表达方阵。

「简记符号」通常有助于概念理解和理论发展,但是未必就是「实用工具」。譬如乘法是连加的简记符号,\(3\times7\) 是七个 \(3\) 的连加,用 \(3\times7\) 代替 \(3+3+3+3+3+3+3\) 显然是个好主意。但是,如果记不得九九乘法表,则 \(3\times7\) 只能用 \(3+3+3+3+3+3+3\) 来计算,那幺乘法就只是简记符号,不是实用的计算工具。

数学概念经常反映在符号的操作,所以「简记符号」的确可以促进概念的发展。但是,工具的功劳不可忽略;没有工具的概念并不能发挥它真正的能耐,就好像没有燃料的汽车不能把人载去远方。让方阵从「简记符号」变成「实用工具」的,当然是电子计算机;这或许可以解释,为何『线性代数』在1960年代以后,在理工科系中变成越来越常见的数学基础科目。

就凯莱的动机而言,方阵乘法来自于两次线性变换的合成。

给定两个线性变换 \(P_1:\left\{\begin{array}{ll}x’=a_{11}x+a_{12}y\\y’=a_{21}x+a_{22}y\end{array}\right.\) 和 \(P_2:\left\{\begin{array}{ll}x’=b_{11}x+b_{12}y\\y’=b_{21}x+b_{22}y\end{array}\right.\),

则 \(P_1\) 的表达方阵就是前述的方阵 \(A\),而 \(P_2\) 的表达方阵是 \(B=\left [\begin{array}{cc}b_{11} & b_{12} \\b_{21} & b_{22}\end{array}\right ]\)。

\(P_1(P_2(x,y))\) 的意义就是点 \((x,y)\) 先经过 \(P_2\) 变换、再经过 \(P_1\) 变换的结果。

因为合成的效果是

\(\left\{\begin{array}{ll}x’&=a_{11}(b_{11}x+b_{12}y)+a_{12}(b_{21}x+b_{22}y)\\&=(a_{11}b_{11}+a_{12}b_{21})x+(a_{11}b_{12}+a_{12}b_{22})y\\y’&=a_{21}(b_{11}x+b_{12}y)+a_{22}(b_{21}x+b_{22}y)\\&=(a_{21}b_{11}+a_{22}b_{21})x+(a_{21}b_{12}+a_{22}b_{22})y\end{array}\right.\)

所以凯莱定义方阵 \(A\) 乘以 \(B\) 的运算规则如下:

\(AB=\left [\begin{array}{cc}a_{11}b_{11}+a_{12}b_{21} & a_{11}b_{12}+a_{12}b_{22}\\a_{21}b_{11}+a_{22}b_{21} &a_{21}b_{12}+a_{22}b_{22}\end{array}\right ]\)

因此 \(P_1(P_2(x,y))=AB\left [\begin{array}{c}x \\y\end{array}\right ]\),也就是说合成变换 \(P_1(P_2(x,y))\) 的表达方阵就是 \(AB\)。

方阵相乘的动机并不仅线性变换这一条线索。柯西早在 1812 年就考虑过行列式乘积相等的算法,用方阵符号来说,就是 \(\det(AB)=(\det A)(\det B)\),其中 \(AB\) 就是方阵的乘积。那是为了扩展行列式性质而做的纯数学研究,所以,虽然柯西的工作较早,但是因为缺乏应用的动机而不宜当作引介方阵的教材。

凯莱诞生于伦敦的一个环境优渥的家庭,17 岁成为剑桥三一学院的大学生。20 岁时发表了最初的数学论文,内容接续了拉格朗日的一件早期工作。因为学术界一职难求,他「暂时」以律师为职业,专司财产转让。但是他对数学的热情显然不曾间断,例如他趁着律师事务所派他去都柏林受教育训练的机会,听了汉弥尔顿的四元数课程。在他以律师为业的十七年间(25-42岁),发表了二百多篇数学论文。在 1863 年,剑桥终于因为一笔新的基金而设立第二个数学「教授」席位:「萨德莱教授」(Sadleirian Professor)。凯莱放弃高薪的律师工作,回到剑桥成为第一位萨德莱教授。在此之前,剑桥只有一席数学教授,就是牛顿做过的「鲁卡斯教授」(Lucasian Professor)。

向前连结:三阶行列式、矩阵乘法、空间向量发展史

延伸阅读: