Chapter 00

为什么要学基础数学？

为理解深度学习与机器学习，为什么需要数学、会用哪些数学，在此简要说明。

home.mathDiagramTitle

home.mathDiagramDescription

Ch01～Ch12 所学内容

理解深度学习与机器学习，需要函数、指数与对数、极限·微分·积分、概率与分布等基础数学，Ch01～Ch12 所学的就是这些。函数是输入→输出的基础；微分与梯度是模型学习时决定参数改哪里、改多少的依据；概率与分布则用于预测与不确定性。

Ch.01
函数
函数是「一个输入对应一个输出」的规则。神经元和层也可以理解为函数。
Ch.02
指数与指数函数
指数表示同一数连乘的次数，指数函数则是把这一规则写成变量的函数。深度学习中的激活与损失设计会用到。
Ch.03
对数函数
对数表示「底乘几次能得到这个数」，是指数的逆运算，在深度学习的损失与概率式中与指数一起使用。
Ch.04
极限与 ε-δ 论述 (ε-δ)
极限描述「无限接近某个值时」会发生什么。ε-δ 是严格定义这一概念的方式，是微分与深度学习的基础。
Ch.05
连续性
在某点连续是指该点处极限存在且等于函数值。它是可微性的基础，也是理解深度学习中激活函数与损失函数的基础。
Ch.06
微分与导函数
微分表示某一点的瞬时变化率（斜率）。导函数是将其视为函数的形式，是深度学习梯度下降与反向传播的基础。
Ch.07
链式法则
对「函数套函数」求导时，用外导数 × 内导数相乘即可。这是反向传播的核心。
Ch.08
偏导数与梯度
当变量有多个时，只对一个变量求导、其余视为常数，就是偏导数；把它们排成向量就是梯度。这是梯度下降的基础。
Ch.09
积分
积分是微分的逆运算，用于求曲线下面积、累积量，并与概率、期望相关。
Ch.10
随机变量与概率分布
随机变量将试验结果用数字表示，概率分布则概括各取值出现的可能性。深度学习中用於预测与不确定性。
Ch.11
均值与方差
Ch.12
均匀分布与正态分布

理解深度学习与机器学习，为什么需要数学

理解深度学习与机器学习需要数学 — 二者都是把输入（图像、文字、声音）变成数字，再用函数反复乘加得到答案。这整个过程就是用函数、极限与微分、概率与分布等数学写成的。不懂这些数学就很难读懂「计算是怎样进行的」；懂了就能解释为什么会得到那样的输出。

会用到的数学 — 函数是「一个输入对应一个输出的规则」，向量与矩阵是把数字打包成批计算的工具。微分与梯度在模型学习时决定参数改哪里、改多少，概率与分布则用于预测与不确定性。所以理解深度学习与机器学习，需要这些基础数学。

小结 — 深度学习与机器学习都是在数字和函数上运行的。要理解其内部，需要掌握函数、极限·微分·梯度、概率与分布。本课程（Ch01～Ch12）就是按顺序讲解「理解深度学习与机器学习所需的基础数学」。

为什么需要数学 — 深度学习、机器学习模型做出的决策（下一个词、推荐、翻译、分类等）都是由数字和函数计算出来的。要读懂这个过程，需要函数（输入→输出）、极限与微分（学习时用的梯度）、概率与分布（预测与不确定性）等基础数学。有了这些数学，才能读懂为什么会得到那个答案。

数学在深度学习与机器学习中的位置 — 层就是对输入做加权乘加的函数，学习就是用梯度调整参数以减小损失的过程。概率与分布用于预测区间、不确定性和损失设计。所以理解深度学习与机器学习，就是要知道这些数学在哪里、怎样被使用。

本课程顺序(Ch01～Ch12) — Ch01 函数 → Ch02·03 指数与对数 → Ch04～05 极限与连续性 → Ch06～08 微分·链式法则·偏微分·梯度 → Ch09 积分 → Ch10～12 随机变量·均值·方差·均匀·正态分布。分别对应输入→输出、学习（梯度）、预测与不确定性。请按左侧章节顺序学习。

理解深度学习与机器学习与数学的对应关系 — 模型是输入→数字→函数反复→输出的结构。函数（Ch01 起）是基本单元，微分与梯度（Ch06～08）在学习时用来决定改哪里、改多少，概率与分布（Ch10～12）用于预测与损失解释。掌握这些基础数学，就更容易理解深度学习与机器学习的内部计算。