Ch.04

矩阵乘法与线性变换：操纵空间的数学

选择章节后，下方图示会切换为该章节内容。可一览中级数学的脉络。

A

左边 同一坐标 的点，右边 一步 到位；整片格子一起被拉长。

A

A

记住这张图就够

T(\mathbf{x})=A\mathbf{x}

A

\mathbf{y} = W\mathbf{x} + \mathbf{b}

矩阵乘法与线性变换：自如编辑空间

(0,0)

A\mathbf{x}

AB

(m\times n)

(x_1,x_2,x_3)

\mathbf{y} = W\mathbf{x} + \mathbf{b}

X

Y = XW^{\mathsf{T}}

QK^{\mathsf{T}}

AB

下表汇总了 维度规则 与 常用公式 。例题按典型类型分步说明。

AB

例题

A

T(\mathbf{x})=A\mathbf{x}

1 / 10

矩阵乘法与线性变换：自如编辑空间

(0,0)

A\mathbf{x}

AB

(m\times n)

(x_1,x_2,x_3)

\mathbf{y} = W\mathbf{x} + \mathbf{b}

X

Y = XW^{\mathsf{T}}

QK^{\mathsf{T}}

AB

下表汇总了 维度规则 与 常用公式 。例题按典型类型分步说明。

AB

例题

A

T(\mathbf{x})=A\mathbf{x}

1 / 10

符号	含义
$AB$	当 $A$ 的列数 = $B$ 的行数时有定义
$(AB)_{ij}$	$A$ 的第 $i$ 行与 $B$ 的第 $j$ 列的内积
$A\mathbf{x}$	由 $A$ 的各行与 $\mathbf{x}$ 的内积组成的向量
$(AB)^{\mathsf T}$	$B^{\mathsf T}A^{\mathsf T}$
合成	$\mathbf{x}\mapsto A(B\mathbf{x})=(AB)\mathbf{x}$
线性层	$\mathbf{y}=W\mathbf{x}+\mathbf{b}$ （权重 $W$ ，偏置 $\mathbf{b}$ ）

符号	含义
$AB$	当 $A$ 的列数 = $B$ 的行数时有定义
$(AB)_{ij}$	$A$ 的第 $i$ 行与 $B$ 的第 $j$ 列的内积
$A\mathbf{x}$	由 $A$ 的各行与 $\mathbf{x}$ 的内积组成的向量
$(AB)^{\mathsf T}$	$B^{\mathsf T}A^{\mathsf T}$
合成	$\mathbf{x}\mapsto A(B\mathbf{x})=(AB)\mathbf{x}$
线性层	$\mathbf{y}=W\mathbf{x}+\mathbf{b}$ （权重 $W$ ，偏置 $\mathbf{b}$ ）