欢迎光临
我们一直在努力

方阵和矩阵的区别

问答中心分类: 其他方阵和矩阵的区别
1 回复
0
忧郁←不归人 回复于 2026-04-18 之前

好,今天我们聊聊方阵和矩阵。这俩兄弟在数学里,尤其是在线性代数里,出镜率特别高。很多人觉得它们差不多,甚至以为方阵就是矩阵的一种特殊情况。这么说也对,但只说对了一半。它们的关系,比你想的要复杂,而且用途也差很多。

我们先从最基本的开始。矩阵是什么?你可以把它想象成一个长方形的表格,里面填满了数字。这个表格有行(横着看)有列(竖着看)。一个矩阵的大小,就是由它的行数和列数决定的。比如说,一个有2行3列的矩阵,我们就叫它 2×3 矩阵。里面的数字可以是任何数,整数、小数、负数都行。

举个例子,假设你开了一个小店,卖三种不同颜色的T恤:红色、蓝色、绿色。你记录了两天的销售数据。第一天,你卖了10件红T恤,5件蓝T恤,8件绿T恤。第二天,卖了12件红的,3件蓝的,10件绿的。这些数据就可以用一个矩阵来表示:

10 5 8
12 3 10

这是一个 2×3 矩阵,2行代表两天,3列代表三种颜色的T恤。你看,矩阵就是一个用来装数据的盒子,非常方便。它可以是任何“长方形”的形状,比如 3×2, 1×5, 5×1,都行。只要是长方形的数表,它就是矩阵。

现在,我们来说方阵。方阵,顾名思义,就是“正方形”的矩阵。也就是说,它的行数和列数必须完全一样。 比如 2×2, 3×3, 4×4 的矩阵,这些都是方阵。我们刚才那个卖T恤的例子,就不是方阵,因为它是 2×3 的,行和列数量不等。

我们重新构造一个例子。假设你在玩一个简单的游戏,有两个角色,A和B。它们之间可以互相移动。从A到A自己(原地不动)的成本是1,从A到B的成本是2。从B到B自己的成本是1,从B到A的成本是3。这个关系就可以用一个方阵表示:

1 2
3 1

这是一个 2×2 的方阵。第一行代表从A出发,第一列代表到达A,第二列代表到达B。所以左上角的1就是从A到A的成本。第二行代表从B出发。你看,行和列都代表同样的东西(角色A和B),所以行数和列数必须相等,这就形成了方阵。

从定义上看,方阵确实是矩阵的一种。所有方阵都是矩阵,但不是所有矩阵都是方陣。 这就像所有的正方形都是长方形,但不是所有长方形都是正方形一样。

但这只是表面。真正的区别,在于它们能做什么,以及它们拥有的特性。这些特性,普通的“长方形”矩阵是没有的。

第一个,也是最重要的特性,叫做“行列式”(Determinant)。只有方阵才能计算行列式。 行列式是一个数值,它能告诉你很多关于这个方阵的信息。比如,在一个二维空间里,一个 2×2 方阵的行列式的绝对值,代表了这个方阵所对应的线性变换对面积的放大或缩小的比例。

听起来有点绕,我举个例子。想象你在电脑屏幕上画一个1×1的小正方形。电脑里的图形变换,很多都是通过矩阵运算实现的。如果用一个 2×2 的方阵去乘以这个正方形的坐标,这个正方形可能会被拉伸、旋转、甚至压扁。变换后得到的新图形,它的面积是多少?就是这个 2×2 方阵的行列式的绝对值。

如果行列式的值是2,那这个小正方形的面积就变成了2。如果行列式是0.5,面积就变成了0.5。如果行列式是0呢?这就意味着这个正方形被压成了一条线,面积变成了0。这个信息非常重要,它告诉我们这个变换是“不可逆”的。就像你把一个3D的苹果模型拍扁成一张2D的照片,你就没法从照片完美地恢复出原来的苹果了。

普通的长方形矩阵,比如我们卖T恤的那个 2×3 矩阵,根本就没有行列式这个概念。你没法问一个长方形矩阵的行列式是多少,这个问题本身就没有意义。

第二个关键区别是“逆矩阵”(Inverse Matrix)。同样,也只有方阵才可能有逆矩阵。 什么是逆矩阵?在普通数字运算里,一个数乘以它的倒数等于1。比如 5 乘以 1/5 等于 1。在矩阵的世界里,一个方阵乘以它的逆矩阵,得到的是一个叫做“单位矩阵”(Identity Matrix)的东西。单位矩阵也是一个方阵,它的对角线上全是1,其他地方全是0,作用就跟数字1差不多。

还是用图形变换的例子。你用一个方阵把一个图形旋转了30度。现在你想把它转回去,怎么办?你只需要乘以这个旋转方阵的逆矩阵就行了。逆矩阵就代表了一个“撤销”操作。

但是,不是所有的方阵都有逆矩阵。什么时候没有呢?就是当它的行列式等于0的时候。 刚才我们说了,行列式是0,意味着空间被“压扁”了。一个被压成线的东西,你怎么可能恢复成原来的样子?信息已经丢失了,所以不存在“撤销”操作,也就不存在逆矩阵。

长方形矩阵呢?它们压根就没有逆矩阵这个说法。因为矩阵乘法对尺寸有要求,一个 m x n 的矩阵要乘以一个 n x k 的矩阵才行。如果一个长方形矩阵 A (m x n) 要找一个逆矩阵 B,那么 A 乘以 B 和 B 乘以 A 都必须等于单位矩阵。这在尺寸上就几乎不可能实现,除非 m 和 n 相等,也就是说,除非它本身就是个方阵。

第三个区别是“特征值”(Eigenvalues)和“特征向量”(Eigenvectors)。这又是一个只有方阵才有的高级特性。 特征向量是一个非零向量,当它被一个方阵作用(相乘)时,它的方向不会改变,只会在原来的方向上被拉伸或压缩。 而特征值,就是这个拉伸或压缩的比例。

这个概念在很多领域都有用。比如在物理学里,研究一个物体的振动模式,就需要用到特征值和特征向量。在谷歌的网页排名算法(PageRank)里,核心思想也是基于寻找一个巨大方阵的特征向量。这个方阵描述了整个互联网的链接结构,而那个特征向量,就对应了每个网页的重要性。

长方形矩阵没有特征值和特征向量。道理很简单,一个 m x n (m≠n) 的矩阵乘以一个 n x 1 的向量(代表一个点或方向),会得到一个 m x 1 的向量。输入和输出的向量维度都不一样,一个在n维空间,一个在m维空间,也就谈不上方向“保持不变”了。

总结一下,区别到底在哪?

定义上:矩阵是长方形的数表,行数和列数可以不一样。方阵是正方形的数表,行数和列数必须一样。方阵是矩阵的特例。

功能和特性上:这是本质区别。

1. 行列式:只有方阵有。它告诉我们空间变换的缩放比例,以及变换是否可逆。

2. 逆矩阵:通常只有方阵有。它代表了“撤销”操作,对于解方程组和恢复变换至关重要。

3. 特征值和特征向量:只有方阵有。它们揭示了变换的核心特性,即在变换中保持方向不变的“骨架”。

所以,你可以这样理解:矩阵是一个通用的数据容器,用途非常广泛,主要是存储和组织数据。比如在机器学习里,我们用矩阵来存储一个数据集,每一行是一个样本,每一列是一个特征。这个矩阵绝大多数情况下都不是方的。

而方阵,它不仅仅是存储数据,它更多地被看作一个“操作”或者“变换”。它描述了同一个空间内的点是如何移动、旋转、缩放的。因为它处理的是同一个空间内的变换(比如从二维空间到二维空间),所以输入和输出的维度必须一样,这也就决定了它必须是方的。

当你看到一个矩阵时,你可以先问自己一个问题:它是在单纯地装数据,还是在描述一个系统内部状态之间的转换?如果是前者,它很可能是一个普通的长方形矩阵。如果是后者,比如描述一个网络中节点的关系,或者一个物理系统的演化,那它大概率会是一个方阵。

所以,下次再看到这两个词,别再简单地认为一个只是另一个的特殊情况。要记住,方阵因为它的“方”,所以拥有了一系列长方形矩阵没有的、强大的数学工具和深刻的物理意义。它能做的事情,远比简单地装数据要多得多。

 

登录

找回密码

注册