大家的AI
机器学习AI论文
加载中…

学习

🏅我的成就

Ch.03

矩阵与数据捆:多向量的结构性表示

按章节的数学图示

选择章节后,下方图示会切换为该章节内容。可一览中级数学的脉络。

标量11向量51732-299矩阵11058299-83478三维张量二维堆叠11058299-8347811058299-8347811058299-83478四维张量三维堆叠五维张量四维堆叠
紫色列会依次高亮。每一列都是相同长度的向量;将三列并排后形成一个矩阵。右侧面板显示 m×nm\times nm×n 以及当前高亮的是哪一列。若按行读取,就是每行一个样本(常见数据约定)。
矩阵是按行按列排列数字的一张表。在机器学习中,一行常常对应一个样本(一个人、一张图),一列对应一个特征。本章将向量(第01章)与点积(第02章)连接到矩阵中同时多次出现的计算,并为矩阵乘法与线性层(第04章)做准备。

矩阵与数据批次:把多个向量放在一张表里

如果说向量是把数字排成一列,那么矩阵就是把多列(或多行)数字组成一个长方形表格。尺寸 m×nm\times nm×n 表示 mmm 行 和 nnn 列。记号会因场景而不同(有时行是样本,有时列是样本),因此要先确认形状。
把矩阵理解成一张电子表格很直观:每个单元格是一个数;整列可以看成一个特征向量;整行可以看成一条记录。同一张表按不同方向读取,语义会不同。
核心事实:
1. 形状:m×nm\times nm×n 表示含实数元素的 mmm 行 nnn 列。
2. 元素:第 iii 行第 jjj 列写作 aija_{ij}aij​。
3. 转置:ATA^{\mathsf T}AT 的形状为 n×mn\times mn×m,且 (AT)ji=aij(A^{\mathsf T})_{ji}=a_{ij}(AT)ji​=aij​。
4. 按列看作向量:若列向量 aj∈Rm\mathbf{a}_j\in\mathbb{R}^maj​∈Rm,可写作 A=[a1 ⋯ an]A=[\mathbf{a}_1\ \cdots\ \mathbf{a}_n]A=[a1​ ⋯ an​]。
5. 加法/数乘:同形状时,(A+B)ij=aij+bij(A+B)_{ij}=a_{ij}+b_{ij}(A+B)ij​=aij​+bij​,(cA)ij=c aij(cA)_{ij}=c\,a_{ij}(cA)ij​=caij​。
本章重点是在完整进入矩阵乘法前,先掌握向量成束的读取方式与维度匹配。
在深度学习中,权重常表示为矩阵(或张量的二维切片)。一层线性变换可视为“同时进行多个点积”;批处理会沿行或列堆叠样本。在机器学习里,设计矩阵也会把特征向量组织到同一张数据表中。
一句话总结: 矩阵是把多个向量放在同一张表的工具;行或列作为样本取决于约定。通过转置可交换轴并匹配维度。第02章的行点积排列起来就是 AuA\mathbf{u}Au 的各个分量。下一章进入矩阵乘法与线性映射。
第01章学向量,第02章学点积。第03章把这些计算扩展到整张表。矩阵是描述损失、梯度、权重更新的共同语言。
真实数据通常是多样本 × 多特征。明确写出形状 m×nm\times nm×n 能清晰表达结构,减少因维度错误导致的隐蔽问题。
训练数据常以设计矩阵表示;线性模型可写成矩阵-向量乘法。逻辑回归/归一化分类函数、线性支持向量机、矩阵分解推荐等都依赖批量向量运算。
列向量会张成一个子空间(列空间);把高维数据拟合到低维,可理解为向子空间做投影(后续章节展开)。
下表汇总了解题所需的符号与维度规则。后续例题展示了常见解题步骤。
  • 记号m×nm\times nm×n
  • 含义mmm 行 nnn 列
  • 记号aija_{ij}aij​
  • 含义第 iii 行第 jjj 列元素
  • 记号ATA^{\mathsf T}AT
  • 含义转置:(AT)ji=aij(A^{\mathsf T})_{ji}=a_{ij}(AT)ji​=aij​
  • 记号列向量 aj\mathbf{a}_jaj​
  • 含义把 AAA 的第 jjj 列看作向量
  • 记号同形状
  • 含义只有维度一致时才可做 A+BA+BA+B
  • 记号AuA\mathbf{u}Au(预告)
  • 含义由每一行与 u\mathbf{u}u 的点积组成的向量
记号含义
m×nm\times nm×nmmm 行 nnn 列
aija_{ij}aij​第 iii 行第 jjj 列元素
ATA^{\mathsf T}AT转置:(AT)ji=aij(A^{\mathsf T})_{ji}=a_{ij}(AT)ji​=aij​
列向量 aj\mathbf{a}_jaj​把 AAA 的第 jjj 列看作向量
同形状只有维度一致时才可做 A+BA+BA+B
AuA\mathbf{u}Au(预告)由每一行与 u\mathbf{u}u 的点积组成的向量
分项说明
① 形状 做加法/乘法前先核对维度。
② 转置 需要时交换样本轴与特征轴。
③ 行/列视角 同一个 AAA 在不同问题中语义可能不同。
④ 与第02章的连接 每行与 u\mathbf{u}u 的点积对应 AuA\mathbf{u}Au 的一个分量。

练习题

以下为从60题题库中随机抽取的10题(易4·中3·难3,顺序为易→中→难)。每题为选择题,请选择选项编号。

零矩阵的正确性质是哪一个?
1 / 10