Ch.03
矩阵与数据捆:多向量的结构性表示
按章节的数学图示
选择章节后,下方图示会切换为该章节内容。可一览中级数学的脉络。
紫色列会依次高亮。每一列都是相同长度的向量;将三列并排后形成一个矩阵。右侧面板显示 以及当前高亮的是哪一列。若按行读取,就是每行一个样本(常见数据约定)。
矩阵是按行按列排列数字的一张表。在机器学习中,一行常常对应一个样本(一个人、一张图),一列对应一个特征。本章将向量(第01章)与点积(第02章)连接到矩阵中同时多次出现的计算,并为矩阵乘法与线性层(第04章)做准备。
矩阵与数据批次:把多个向量放在一张表里
如果说向量是把数字排成一列,那么矩阵就是把多列(或多行)数字组成一个长方形表格。尺寸 表示 行 和 列。记号会因场景而不同(有时行是样本,有时列是样本),因此要先确认形状。
把矩阵理解成一张电子表格很直观:每个单元格是一个数;整列可以看成一个特征向量;整行可以看成一条记录。同一张表按不同方向读取,语义会不同。
核心事实:
1. 形状: 表示含实数元素的 行 列。
2. 元素:第 行第 列写作 。
3. 转置: 的形状为 ,且 。
4. 按列看作向量:若列向量 ,可写作 。
5. 加法/数乘:同形状时,,。
本章重点是在完整进入矩阵乘法前,先掌握向量成束的读取方式与维度匹配。
在深度学习中,权重常表示为矩阵(或张量的二维切片)。一层线性变换可视为“同时进行多个点积”;批处理会沿行或列堆叠样本。在机器学习里,设计矩阵也会把特征向量组织到同一张数据表中。
一句话总结: 矩阵是把多个向量放在同一张表的工具;行或列作为样本取决于约定。通过转置可交换轴并匹配维度。第02章的行点积排列起来就是 的各个分量。下一章进入矩阵乘法与线性映射。
第01章学向量,第02章学点积。第03章把这些计算扩展到整张表。矩阵是描述损失、梯度、权重更新的共同语言。
真实数据通常是多样本 × 多特征。明确写出形状 能清晰表达结构,减少因维度错误导致的隐蔽问题。
训练数据常以设计矩阵表示;线性模型可写成矩阵-向量乘法。逻辑回归/归一化分类函数、线性支持向量机、矩阵分解推荐等都依赖批量向量运算。
列向量会张成一个子空间(列空间);把高维数据拟合到低维,可理解为向子空间做投影(后续章节展开)。
下表汇总了解题所需的符号与维度规则。后续例题展示了常见解题步骤。
- 记号
- 含义 行 列
- 记号
- 含义第 行第 列元素
- 记号
- 含义转置:
- 记号列向量
- 含义把 的第 列看作向量
- 记号同形状
- 含义只有维度一致时才可做
- 记号(预告)
- 含义由每一行与 的点积组成的向量
| 记号 | 含义 |
|---|---|
| 行 列 | |
| 第 行第 列元素 | |
| 转置: | |
| 列向量 | 把 的第 列看作向量 |
| 同形状 | 只有维度一致时才可做 |
| (预告) | 由每一行与 的点积组成的向量 |
分项说明
① 形状 做加法/乘法前先核对维度。
② 转置 需要时交换样本轴与特征轴。
③ 行/列视角 同一个 在不同问题中语义可能不同。
④ 与第02章的连接 每行与 的点积对应 的一个分量。
练习题
以下为从60题题库中随机抽取的10题(易4·中3·难3,顺序为易→中→难)。每题为选择题,请选择选项编号。
零矩阵的正确性质是哪一个?
1 / 10