Chapter 00
基础数学与人工智能:学习AI的语言
为理解深度学习与机器学习,为什么需要数学、会用到哪些数学工具,我们将一起画出这张地图。
按章节的数学图示
选择章节后,下方图示会切换为该章节内容。可一览基础数学的脉络。
Ch01~Ch12 所学内容
理解深度学习与机器学习,需要函数、指数与对数、极限·微分·积分、概率与分布等基础数学,Ch01~Ch12 所学的就是这些。函数是输入→输出的基础;微分与梯度是模型学习时决定参数改哪里、改多少的依据;概率与分布则用于预测与不确定性。
- Ch.01函数:连接输入与输出的AI基本单元
函数是「一个输入对应一个输出」的规则。人工智能把输入变成输出的方式,也直接对应这一函数概念。
- Ch.02指数与指数函数:增长与激活的数学
指数表示同一数连乘的次数,指数函数则是把这一规则写成变量的函数。深度学习中的激活与损失设计会用到。
- Ch.03对数函数:从乘法到加法,损失设计的语言
对数表示「底乘几次能得到这个数」,是指数的逆运算,在深度学习的损失与概率式中与指数一起使用。
- Ch.04极限与 ε-δ:定义「无限接近」
极限是「即使不到达目标点,也能预测该处状态」的数学工具。测量运动物体的瞬时速度,或人工智能一步步逼近答案的「学习」过程,都建立在这一极限概念之上。
- Ch.05连续性:不断开的曲线,打开微分之门
在某点连续是指该点处极限存在且等于函数值。它是可微性的基础,也是理解深度学习中激活函数与损失函数的基础。
- Ch.06微分与导函数:瞬时斜率,学习的指南针
微分表示某一点的瞬时变化率(斜率)。导函数是将其视为函数的形式,是深度学习梯度下降与反向传播的基础。
- Ch.07链式法则:拆解复合函数,反向传播的核心
对「函数套函数」求导时,用外导数 × 内导数相乘即可。这是反向传播的核心。
- Ch.08偏导数与梯度:多变量的世界,梯度下降的方向
当变量有多个时,只对一个变量求导、其余视为常数,就是偏导数;把它们排成向量就是梯度。这是梯度下降的基础。
- Ch.09积分:面积与累积,通往概率的桥梁
积分是微分的逆运算,用于求曲线下面积、累积量,并与概率、期望相关。
- Ch.10随机变量与概率分布:用数字刻画不确定性
随机变量将试验结果用数字表示,概率分布则概括各取值出现的可能性。深度学习中用於预测与不确定性。
- Ch.11均值与方差:分布的中心与离散程度
均值(期望)表示分布的中心,方差表示离散程度。在 AI 中用于预测、损失与正则化。
- Ch.12均匀分布与正态分布:从初始化到预测
均匀分布在区间上均匀分布概率,正态分布围绕均值呈钟形。在 AI 中用于初始化、噪声与先验。
理解深度学习与机器学习,为什么需要数学
理解AI需要数学这副眼镜 — 深度学习与机器学习会把我们提供的图像、文字、声音都变成数字。这些数字经过函数这条通道,通过反复乘法和加法寻找答案。整个过程都用数学书写,所以掌握数学就能清晰读出AI的内部运作。
会用到哪些数学工具? — 我们会学习规定输入与输出规则的函数、把大量数据打包一次处理的向量与矩阵、让模型自己学习并逼近答案的微分,以及衡量结果可能性的概率与分布。这些工具组合在一起,构成智能的AI。
小结 — AI运行在数字与函数构成的坚实基础上。要解释AI为何给出某个结果、并设计更好的模型,必须具备函数、极限、微分、概率等基础能力。本课程就是一步步打好这一基础的旅程。
为了理解AI的决策依据 — AI做出的每一个决策,归根结底都是数字与函数计算的结果。我们学习函数与微分,就是为了跟上计算过程,在逻辑上理解为什么得到那个答案。
数学在AI模型中的位置 — 模型的每一层都是做「乘权重、相加」的函数的集合。AI通过学习减小误差的过程,使用的就是梯度这一微分概念。概率则成为衡量AI对自身预测有多大把握的指标。
我们将一起走的路线图(Ch01~Ch12) — 本课程按以下顺序进行:处理数据流的函数(Ch01~03)、处理变化基础的极限与连续(Ch04~05)、学习核心的微分(Ch06~08)、作为累积与概率基础的积分(Ch09),以及处理不确定性的概率与分布(Ch10~12)。
现实与数学的桥梁 — AI模型具有输入→转为数字→反复经过函数→输出的结构。函数是这座建筑的砖块,微分是让砖块更聪明的凿子,概率是检验建成后建筑稳定性的工具。掌握这些基础数学后,深度学习中复杂的公式才会开始像有意义的句子一样被读懂。
- 区分输入与输出
- 在AI中的角色放入数据并得到答案的基本框架
- 核心数学概念函数、指数、对数
- 区分学习(训练)
- 在AI中的角色减少误差、逼近正确答案的过程
- 核心数学概念极限、微分、链式法则
- 区分预测与判断
- 在AI中的角色在不确定结果中选择最优
- 核心数学概念概率、统计、正态分布
| 区分 | 在AI中的角色 | 核心数学概念 |
|---|---|---|
| 输入与输出 | 放入数据并得到答案的基本框架 | 函数、指数、对数 |
| 学习(训练) | 减少误差、逼近正确答案的过程 | 极限、微分、链式法则 |
| 预测与判断 | 在不确定结果中选择最优 | 概率、统计、正态分布 |