

什么是列空间？以机器学习为例

数据分析学习与实践

2025-03-15

1. , 或是什么意思？

[!question] , 或是什么意思？

您是否遇到过类似 , 或这样的数学表达式，并想知道它们是什么意思？

在这篇文章中，我们将为你揭开这些符号的神秘面纱，让你领略高维度向量的优雅与强大。

首先，让我们来看看这个符号。简单地说，表示二维空间，由两个实数（坐标）定义。这就是我们在基础几何中经常看到的平面。

扩展到三维空间，我们就有了，其中每个点都由一个包含三个分量的列向量表示。这些向量描述了三维空间中的点。三维点在现实世界的许多应用中都会用到，如计算机制图和物理模拟。

的概念是这一思想的自然延伸，其中代表维数。要将想象成中的一个点，可将其想象成一个有个分量的列向量。我们使用字母 "R" 是因为向量的分量是实数。

线性代数之所以用途广泛，其中一个原因是它的数学原理很容易扩展到更高的维。例如，如果我们想在中定义一个向量，只需要7个实数，如[4, 1, 8, 5, 9, 5, 6]。如果你用 100 个随机数写出一个向量，那么你的向量就属于。

将 100 维空间可视化是很困难，但利用线性代数，我们可以处理这些向量并对其进行各种运算，就像处理维空间一样。

2. 当人们说 "矢量空间"、"列空间"、"子空间"等时，他们所说的 "空间" 是什么意思？

可以简单的认为 "空间" 是 "子空间"的简称。"子空间"是在加法和标量乘法运算下"封闭"的子集，这与在线性组合运算下封闭基本相同。这两种运算的输出结果总是保持在子空间内。

[! note] 子空间的定义：向量空间的子空间是满足向量空间要求的子集 -- 线性组合留在子空间中。 (i). 如果任何两个向量和都在子空间中，那么也在子空间中。 (ii). 如果我们将子空间中的任何向量乘以任何标量，也在子空间中。

光看定义并不能帮助我理解这个概念。让我们试着回答这个问题，以确保我们能理解：

[!question] x-y 平面的第一象限：它是一个子空间吗？

让我们先看看规则 (i) 是否成立。如果我们将第一象限中的任意两个向量 ( ， )和 ( ， ) 相加，将位于同一个子空间中。好的，到目前为止一切顺利。那么规则（ii）呢？让我们在第一象限选取任意标量和向量 ]。现在，在第三象限，而不在第一象限。因此，第一象限不是一个子空间。

假设我们把第三象限和第一象限都包括在内。那么标量乘法就没问题了。每个倍数（）都会留在这个子集中。但是现在，规则（i）被违反了，因为加上会得到，而这个子集不在任何一个象限中。所以，包含第一象限的最小子空间就是整个空间。

什么是列空间？

矩阵的列空间是的列所跨的空间。同样，的行也横跨一个行空间。

网格上的每一点都是两个向量的线性组合。

在上图（左）中，蓝色向量和红色向量横跨整个平面。

看右边的图片。矢量不一定要相互正交才能跨越平面。只要它们不平行，它们的线性组合就会充满（或 “跨越”）整个平面。

[!note] 的列空间 = 列的跨度 = 列的所有可能线性组合的集合

将矩阵乘以任意向量，得到列的组合。因此，向量位于列空间。

求解 Xθ = y.

让我们来探索方程，其中是一个矩阵，和是列向量。

公式 (a)

在公式 (a) 中，乍一看有 2 个未知数和 3 个方程。通常，当方程数多于未知数时，就没有解了。

请注意，方程的数量决定了列向量的维数。例如，如果我们有 10 个方程，而不是 3 个，那么我们将解决一个 10 维的问题。

公式 (a) 也可以写成公式 (b)。

公式 (b)列的组合

右边的向量可以是各列的任意线性组合。

只是众多可能向量中的一个例子。

例如，如果我们选择和，那么就等于的第一列。相反，如果我们设置和，那么就等于的第二列。

列空间：三维空间中横跨的二维平面。

然而，如果位于（表示为）列所跨平面的外，那么就不能表示为这些列的线性组合。在这种情况下，系统无解。

跨平面不仅仅是的子集。它是一个子空间。它包含了列的每一个可能的线性组合，并满足规则(i)和(ii)。

[!note] 只有当位于两个列向量（的列的组合）所跨过的平面内时，才能求解。

[!tips] 一些补充说明：

线性回归是、和的一个很好的例子。比如，我们要预测房价。是一个特征矩阵（卧室数量、平方英尺、位置等），是一个目标变量（如房价），是我们想要拟合的系数向量。在这里，"y 位于列空间" 意味着回归误差为零，而这在现实生活中从未发生过。
为什么和跨越平面？因为只存在 2 个矢量😜。我们需要 3 个矢量才能跨越三维空间。它们是三维矢量，但不一定能跨越三维平面。两个二维向量，如（1,0）和（4,1）会跨越一个平面。两个七维向量（[2,0,9,0,1,4,2]和（[7,7,0,1,8,4,8]）仍然会跨越平面。
我们允许奇异矩阵或任何形状的矩形矩阵，那么将位于零空间和之间。

当微积分遇到几何：美丽的联系

"机器学习"部分终于开始了。在继续阅读之前，请确保您理解了 "正交性"的含义。

当不在平面上时（=当不在的列空间中时），无解。因为系统是不一致的。

然而，在现实生活中，我们仍然需要找到一个解，它是的最佳近似值。因此，我们使用线性回归。99.99%的情况下，数据点不可能正好位于所跨的平面上。线性回归会找到一个，使数据点与所跨的平面之间的距离最小。换句话说，它能找到最接近数据点的平面。

一个简单的二维示例

方程数量多于未知数数量。→ 无解？

当、、的比为 1:5:3 时，①可解。

当、、的比例不是 1:5:3，我们仍然可以通过最小平方误差来 “求解”（更像是 “拟合”）。

当存在精确解时，最小误差将为零。然而，在现实生活中，与并不完全成正比，(误差)² 的图形将是一条抛物线。

(Error)² 的导数为零的点就是误差最小的地方。

如果你看看步骤④中推导出的，它与我们在上一篇文章中推导出的“正态方程”相吻合。

在微积分中，为了找到最小值，我们需要求出 (Error²) 的导数，并将其设为零。

从几何角度看，最小误差线（或平面）与误差向量正交，因此点积为零。

[!note] note 因为它们的点积为零，所以误差向量（）必须垂直于。这将使误差²最小。在这里，几何证实了微积分！

当我们学习线性回归时，我们通常以分析的方式来学习它；然而，我们也可以用几何的方式来看待它。我认为这是两个概念之间的美妙互动，有助于我们更好地理解它们。

提高你的游戏水平：三维示例。

让我们把投射到一个子空间（平面）上，而不仅仅是投射到一条直线上。

找到使误差最小的，等同于定位列空间中与中任何其他点相比尽可能接近的点。

回到公式 (a)，现在是一个 3 乘 2 的矩阵，而是 1 乘 2 的矩阵（不再是标量）。将视为设计矩阵，其中有三个样本和两个特征。

大多数情况下，样本数（本例中为 3，或任意）会远大于特征数（2，或任意）。因此，我们认为不会有精确的解决方案。换句话说，不可能是列的线性组合。很可能位于列空间之外。

[!note] 这是到位于的列空间中的点之间的距离。

寻找误差最小的最小平方解 ( )，与将点尽可能靠近列空间中的任何其他点定位是一样的。

所有垂直于列空间的向量都位于左空空间。因此，误差向量位于的无效空间中。

微积分和几何为最小二乘问题提供了互补的视角。

几何学与微积分学的完美结合。

【声明】内容源于网络

数据分析学习与实践

数据分析，数据科学，线性代数，统计学，AI，python，可视化，excel

内容 343

粉丝 0

数据分析学习与实践数据分析，数据科学，线性代数，统计学，AI，python，可视化，excel

总阅读14

粉丝0

内容343

什么是列空间？ 以机器学习为例

1. , 或 是什么意思？