方阵和矩阵的区别

问答中心 › 分类: 其他 › 方阵和矩阵的区别

0 赞踩

墨香飘

方阵和矩阵的区别

1 回复

0 赞踩

忧郁←不归人回复于 2026-04-18 之前

好，今天我们聊聊方阵和矩阵。这俩兄弟在数学里，尤其是在线性代数里，出镜率特别高。很多人觉得它们差不多，甚至以为方阵就是矩阵的一种特殊情况。这么说也对，但只说对了一半。它们的关系，比你想的要复杂，而且用途也差很多。

我们先从最基本的开始。矩阵是什么？你可以把它想象成一个长方形的表格，里面填满了数字。这个表格有行（横着看）有列（竖着看）。一个矩阵的大小，就是由它的行数和列数决定的。比如说，一个有2行3列的矩阵，我们就叫它 2×3 矩阵。里面的数字可以是任何数，整数、小数、负数都行。

举个例子，假设你开了一个小店，卖三种不同颜色的T恤：红色、蓝色、绿色。你记录了两天的销售数据。第一天，你卖了10件红T恤，5件蓝T恤，8件绿T恤。第二天，卖了12件红的，3件蓝的，10件绿的。这些数据就可以用一个矩阵来表示：

10	5	8
12	3	10

这是一个 2×3 矩阵，2行代表两天，3列代表三种颜色的T恤。你看，矩阵就是一个用来装数据的盒子，非常方便。它可以是任何“长方形”的形状，比如 3×2, 1×5, 5×1，都行。只要是长方形的数表，它就是矩阵。

现在，我们来说方阵。方阵，顾名思义，就是“正方形”的矩阵。也就是说，它的行数和列数必须完全一样。比如 2×2, 3×3, 4×4 的矩阵，这些都是方阵。我们刚才那个卖T恤的例子，就不是方阵，因为它是 2×3 的，行和列数量不等。

我们重新构造一个例子。假设你在玩一个简单的游戏，有两个角色，A和B。它们之间可以互相移动。从A到A自己（原地不动）的成本是1，从A到B的成本是2。从B到B自己的成本是1，从B到A的成本是3。这个关系就可以用一个方阵表示：

1	2
3	1

这是一个 2×2 的方阵。第一行代表从A出发，第一列代表到达A，第二列代表到达B。所以左上角的1就是从A到A的成本。第二行代表从B出发。你看，行和列都代表同样的东西（角色A和B），所以行数和列数必须相等，这就形成了方阵。

从定义上看，方阵确实是矩阵的一种。所有方阵都是矩阵，但不是所有矩阵都是方陣。这就像所有的正方形都是长方形，但不是所有长方形都是正方形一样。

但这只是表面。真正的区别，在于它们能做什么，以及它们拥有的特性。这些特性，普通的“长方形”矩阵是没有的。

第一个，也是最重要的特性，叫做“行列式”（Determinant）。只有方阵才能计算行列式。行列式是一个数值，它能告诉你很多关于这个方阵的信息。比如，在一个二维空间里，一个 2×2 方阵的行列式的绝对值，代表了这个方阵所对应的线性变换对面积的放大或缩小的比例。

听起来有点绕，我举个例子。想象你在电脑屏幕上画一个1×1的小正方形。电脑里的图形变换，很多都是通过矩阵运算实现的。如果用一个 2×2 的方阵去乘以这个正方形的坐标，这个正方形可能会被拉伸、旋转、甚至压扁。变换后得到的新图形，它的面积是多少？就是这个 2×2 方阵的行列式的绝对值。

如果行列式的值是2，那这个小正方形的面积就变成了2。如果行列式是0.5，面积就变成了0.5。如果行列式是0呢？这就意味着这个正方形被压成了一条线，面积变成了0。这个信息非常重要，它告诉我们这个变换是“不可逆”的。就像你把一个3D的苹果模型拍扁成一张2D的照片，你就没法从照片完美地恢复出原来的苹果了。

普通的长方形矩阵，比如我们卖T恤的那个 2×3 矩阵，根本就没有行列式这个概念。你没法问一个长方形矩阵的行列式是多少，这个问题本身就没有意义。

第二个关键区别是“逆矩阵”（Inverse Matrix）。同样，也只有方阵才可能有逆矩阵。什么是逆矩阵？在普通数字运算里，一个数乘以它的倒数等于1。比如 5 乘以 1/5 等于 1。在矩阵的世界里，一个方阵乘以它的逆矩阵，得到的是一个叫做“单位矩阵”（Identity Matrix）的东西。单位矩阵也是一个方阵，它的对角线上全是1，其他地方全是0，作用就跟数字1差不多。

还是用图形变换的例子。你用一个方阵把一个图形旋转了30度。现在你想把它转回去，怎么办？你只需要乘以这个旋转方阵的逆矩阵就行了。逆矩阵就代表了一个“撤销”操作。

但是，不是所有的方阵都有逆矩阵。什么时候没有呢？就是当它的行列式等于0的时候。刚才我们说了，行列式是0，意味着空间被“压扁”了。一个被压成线的东西，你怎么可能恢复成原来的样子？信息已经丢失了，所以不存在“撤销”操作，也就不存在逆矩阵。

长方形矩阵呢？它们压根就没有逆矩阵这个说法。因为矩阵乘法对尺寸有要求，一个 m x n 的矩阵要乘以一个 n x k 的矩阵才行。如果一个长方形矩阵 A (m x n) 要找一个逆矩阵 B，那么 A 乘以 B 和 B 乘以 A 都必须等于单位矩阵。这在尺寸上就几乎不可能实现，除非 m 和 n 相等，也就是说，除非它本身就是个方阵。

第三个区别是“特征值”（Eigenvalues）和“特征向量”（Eigenvectors）。这又是一个只有方阵才有的高级特性。特征向量是一个非零向量，当它被一个方阵作用（相乘）时，它的方向不会改变，只会在原来的方向上被拉伸或压缩。而特征值，就是这个拉伸或压缩的比例。

这个概念在很多领域都有用。比如在物理学里，研究一个物体的振动模式，就需要用到特征值和特征向量。在谷歌的网页排名算法（PageRank）里，核心思想也是基于寻找一个巨大方阵的特征向量。这个方阵描述了整个互联网的链接结构，而那个特征向量，就对应了每个网页的重要性。

长方形矩阵没有特征值和特征向量。道理很简单，一个 m x n (m≠n) 的矩阵乘以一个 n x 1 的向量（代表一个点或方向），会得到一个 m x 1 的向量。输入和输出的向量维度都不一样，一个在n维空间，一个在m维空间，也就谈不上方向“保持不变”了。

总结一下，区别到底在哪？

定义上：矩阵是长方形的数表，行数和列数可以不一样。方阵是正方形的数表，行数和列数必须一样。方阵是矩阵的特例。

功能和特性上：这是本质区别。

1. 行列式：只有方阵有。它告诉我们空间变换的缩放比例，以及变换是否可逆。

2. 逆矩阵：通常只有方阵有。它代表了“撤销”操作，对于解方程组和恢复变换至关重要。

3. 特征值和特征向量：只有方阵有。它们揭示了变换的核心特性，即在变换中保持方向不变的“骨架”。

所以，你可以这样理解：矩阵是一个通用的数据容器，用途非常广泛，主要是存储和组织数据。比如在机器学习里，我们用矩阵来存储一个数据集，每一行是一个样本，每一列是一个特征。这个矩阵绝大多数情况下都不是方的。

而方阵，它不仅仅是存储数据，它更多地被看作一个“操作”或者“变换”。它描述了同一个空间内的点是如何移动、旋转、缩放的。因为它处理的是同一个空间内的变换（比如从二维空间到二维空间），所以输入和输出的维度必须一样，这也就决定了它必须是方的。

当你看到一个矩阵时，你可以先问自己一个问题：它是在单纯地装数据，还是在描述一个系统内部状态之间的转换？如果是前者，它很可能是一个普通的长方形矩阵。如果是后者，比如描述一个网络中节点的关系，或者一个物理系统的演化，那它大概率会是一个方阵。

所以，下次再看到这两个词，别再简单地认为一个只是另一个的特殊情况。要记住，方阵因为它的“方”，所以拥有了一系列长方形矩阵没有的、强大的数学工具和深刻的物理意义。它能做的事情，远比简单地装数据要多得多。

方阵和矩阵的区别

切换注册登录

切换登录注册

相关推荐

切换注册登录

切换登录注册