Chapter 00
为什么要学基础数学?
为理解深度学习与机器学习,为什么需要数学、会用哪些数学,在此简要说明。
home.mathDiagramTitle
home.mathDiagramDescription
Ch01~Ch12 所学内容
理解深度学习与机器学习,需要函数、指数与对数、极限·微分·积分、概率与分布等基础数学,Ch01~Ch12 所学的就是这些。函数是输入→输出的基础;微分与梯度是模型学习时决定参数改哪里、改多少的依据;概率与分布则用于预测与不确定性。
- Ch.01函数
函数是「一个输入对应一个输出」的规则。神经元和层也可以理解为函数。
- Ch.02指数与指数函数
指数表示同一数连乘的次数,指数函数则是把这一规则写成变量的函数。深度学习中的激活与损失设计会用到。
- Ch.03对数函数
对数表示「底乘几次能得到这个数」,是指数的逆运算,在深度学习的损失与概率式中与指数一起使用。
- Ch.04极限与 ε-δ 论述 (ε-δ)
极限描述「无限接近某个值时」会发生什么。ε-δ 是严格定义这一概念的方式,是微分与深度学习的基础。
- Ch.05连续性
在某点连续是指该点处极限存在且等于函数值。它是可微性的基础,也是理解深度学习中激活函数与损失函数的基础。
- Ch.06微分与导函数
微分表示某一点的瞬时变化率(斜率)。导函数是将其视为函数的形式,是深度学习梯度下降与反向传播的基础。
- Ch.07链式法则
对「函数套函数」求导时,用外导数 × 内导数相乘即可。这是反向传播的核心。
- Ch.08偏导数与梯度
当变量有多个时,只对一个变量求导、其余视为常数,就是偏导数;把它们排成向量就是梯度。这是梯度下降的基础。
- Ch.09积分
积分是微分的逆运算,用于求曲线下面积、累积量,并与概率、期望相关。
- Ch.10随机变量与概率分布
随机变量将试验结果用数字表示,概率分布则概括各取值出现的可能性。深度学习中用於预测与不确定性。
- Ch.11均值与方差
- Ch.12均匀分布与正态分布
理解深度学习与机器学习,为什么需要数学
理解深度学习与机器学习需要数学 — 二者都是把输入(图像、文字、声音)变成数字,再用函数反复乘加得到答案。这整个过程就是用函数、极限与微分、概率与分布等数学写成的。不懂这些数学就很难读懂「计算是怎样进行的」;懂了就能解释为什么会得到那样的输出。
会用到的数学 — 函数是「一个输入对应一个输出的规则」,向量与矩阵是把数字打包成批计算的工具。微分与梯度在模型学习时决定参数改哪里、改多少,概率与分布则用于预测与不确定性。所以理解深度学习与机器学习,需要这些基础数学。
小结 — 深度学习与机器学习都是在数字和函数上运行的。要理解其内部,需要掌握函数、极限·微分·梯度、概率与分布。本课程(Ch01~Ch12)就是按顺序讲解「理解深度学习与机器学习所需的基础数学」。
为什么需要数学 — 深度学习、机器学习模型做出的决策(下一个词、推荐、翻译、分类等)都是由数字和函数计算出来的。要读懂这个过程,需要函数(输入→输出)、极限与微分(学习时用的梯度)、概率与分布(预测与不确定性)等基础数学。有了这些数学,才能读懂为什么会得到那个答案。
数学在深度学习与机器学习中的位置 — 层就是对输入做加权乘加的函数,学习就是用梯度调整参数以减小损失的过程。概率与分布用于预测区间、不确定性和损失设计。所以理解深度学习与机器学习,就是要知道这些数学在哪里、怎样被使用。
本课程顺序(Ch01~Ch12) — Ch01 函数 → Ch02·03 指数与对数 → Ch04~05 极限与连续性 → Ch06~08 微分·链式法则·偏微分·梯度 → Ch09 积分 → Ch10~12 随机变量·均值·方差·均匀·正态分布。分别对应输入→输出、学习(梯度)、预测与不确定性。请按左侧章节顺序学习。
理解深度学习与机器学习与数学的对应关系 — 模型是输入→数字→函数反复→输出的结构。函数(Ch01 起)是基本单元,微分与梯度(Ch06~08)在学习时用来决定改哪里、改多少,概率与分布(Ch10~12)用于预测与损失解释。掌握这些基础数学,就更容易理解深度学习与机器学习的内部计算。