Ch.02
向量的内积与投影:数据间的角度与相似度
按章节的数学图示
选择章节后,下方图示会切换为该章节内容。可一览中级数学的脉络。
坐标平面:u、v、正交投影
基准 u旋转 v影子残差 ⊥ u
方向·相似度·数值
−10+1
内积 u·v
13.32
cos θ(方向)
0.969
|proj| / |v|
0.969
绿色向量 旋转时 改变,琥珀色影子(正交投影)的长度与 内积、 同步变化。越接近同向 内积越大,垂直为 ,反向为负。右侧小圆单独显示 的方向。
内积(点积)把两个向量“在多大程度上同向”压缩成一个数。正交投影是把一个向量投到另一个向量张成的直线(或子空间)上,像影子一样。基于 Ch.01 的 ,本章用内积语言阅读相似性、角度与距离,并自然衔接到机器学习与深度学习中的相似度、注意力与线性层。
向量的内积与正交投影:用数字衡量有多相似
内积把 Ch.01 里“对应分量相乘再相加”一次性收成一个数。几何上它是 ;正交投影是用内积除以基准方向长度得到的影子向量。
通俗说,内积就是两个箭头有多同向的得分。完全同向时大正,垂直为0,反向为负。正交投影可想成手电筒照在墙上的影子。
下面这些是要记住的核心公式。
1. 内积:(用两个向量的长度和夹角 )
2. 余弦相似度:(长度不同也只比方向有多像)
3. 正交投影:(把 沿基准向量 的方向“落到直线上”的影子)
4. 单位向量: 上的“帽子”(^)常表示更关心方向。单位向量就是长度为 1 的箭头(),多长已经定好,只剩指向哪边。因此 投到 上的影子可以一步写成 。 这一个数表示 与该方向有多同向;影子的实际长度是这个数的大小 。(若为负,说明影子在该直线反方向;只看长度用绝对值。)
其中 、 是向量的范数(长度)。余弦相似度除以二者长度之积,消掉大小影响,只留下方向。
式子看起来密,其实只是计算机给“相似程度”打分的规则。
深度学习里每层线性变换都是权重行与输入的内积堆叠。注意力用查询–键内积(或等价分数)决定关注哪里。推荐里用户/物品嵌入的内积/余弦表示偏好匹配。
一句话:内积是分量乘积之和,把长度与夹角绑在一起;正交投影是沿某方向的影子向量;余弦偏重方向;投影与正交分解相配。下一章 Ch.03 矩阵一次打包许多内积。
在 Ch.01 把向量看成“数字盒子”之后,本章规定如何把盒子配对成一个分数。这个分数成为距离·角度·相似度的共同语言,并通向矩阵、特征值与优化。
要让计算机理解“相似”,需要度量。内积与余弦能在高维里分离方向与长度,并与归一化等预处理密切相关。
机器学习:kNN 的相似度、核方法的起点、线性/逻辑回归的线性项 等都用到内积。
几何视角:最小二乘解可看作向列空间的投影;PCA 主成分、Gram–Schmidt 的“减去投影”都是同一套图景。
下表汇总解题所需的公式与符号含义,紧随其后的分项说明阐明定义意图。例题给出各代表题型的步骤。
- 公式
- 含义同下标分量相乘再求和;结果为标量
- 公式
- 含义欧氏范数(长度)
- 公式
- 含义 — 两向量夹角的余弦(排除零向量)
- 公式
- 含义将 沿 所在直线正交投影得到的向量
- 公式
- 含义减去投影后的残差;恒与 正交
- 公式单位向量
- 含义;投影长度
| 公式 | 含义 |
|---|---|
| 同下标分量相乘再求和;结果为标量 | |
| 欧氏范数(长度) | |
| — 两向量夹角的余弦(排除零向量) | |
| 将 沿 所在直线正交投影得到的向量 | |
| 减去投影后的残差;恒与 正交 | |
| 单位向量 | ;投影长度 |
分项说明
① 与 Ch.01 相同:同下标分量相乘后全部相加。结果是一个实数(标量),不是向量。在 常写成 。
② 由 给出,是欧氏长度。先定义内积再读范数很自然。
③ 对夹角 ,。分母不为零时讨论,通常排除零向量。同向接近 ,正交为 ,反向为负。
④ 对非零 为 。可理解为把 垂直落到 所在直线上的影子向量。
⑤ 是残差,恒与 正交,且 构成正交分解。
⑥ 单位向量 若 ,则投影为 , 是 在 方向上的影子长度。
练习题
以下从 60 题题库中随机抽取 10 题(易 4·中 3·难 3,顺序易→中→难)。每题为选择题,请选编号。
逻辑回归中 , 主要表示?
1 / 10