Chapter 00

什么是深度学习？

介绍深度学习是什么，以及 Ch01～Ch12 将学到的内容一览。

按章节的深度学习图示

每完成一章，下方图示会逐步填满。这是目前的结构。

Ch01～Ch12 所学内容

Chapter 01
向量内积
将两个向量的方向与大小相乘得到一个标量的最基本运算。
Chapter 02
矩阵乘法
两个矩阵的积由前矩阵的行与后矩阵的列做内积填满新矩阵。
Chapter 03
线性层（权重与偏置）
对输入乘以权重矩阵并加上偏置的层。
Chapter 04
激活函数（非线性）
将神经元输出变为非线性的函数。
Chapter 05
人工神经元（加权和与激活）
计算输入的加权和并施加激活函数的单元。
Chapter 06
批（一次性计算）
将多个样本一起成批计算的单位。
Chapter 07
权重连接
层与层、神经元与神经元之间的加权连接。
Chapter 08
隐藏层（看不见的层）
位于输入层与输出层之间的层。
Chapter 09
深度（深层网络）
隐藏层多、层数多；即「深度学习」中的「深度」。
Chapter 10
宽度（每层神经元数）
单层中神经元数量多。
Chapter 11
Softmax（转为概率）
将向量变为（0,1）内且和为1的概率分布的函数。
Chapter 12
梯度（反向传播）
参数微调时损失变化的方向与大小。

什么是深度学习？

深度学习是让计算机通过大量例子自己学会规律的一种方法。不是人一条条写规则，而是给它数据，它自己找出「这类输入对应这类输出」。实现这一点的结构叫人工神经网络：像大脑神经元一样的小计算单元，一层层叠起来，就是深度学习。

为什么深度学习重要？ 我们身边的很多技术都在用。ChatGPT、Gemini 这类对话和文本生成 AI，特斯拉式的自动驾驶（用摄像头识别车道、行人、信号灯），Netflix、YouTube 的推荐，翻译，人脸识别，原理都一样：把输入变成数字，一层层做乘法、加法，得到结果（分类、预测、生成）。实际上，各行各业（IT、医疗、金融、制造等）和学术界里，机器学习、深度学习的研究都占主导。

用市面上的高性能模型不行吗？ 使用市面上的高性能模型，或者做深度学习、机器学习模型，用氛围编程都能做到。但要把那个模型用好、修改或活用，就需要这些章节里的基础知识（内积、矩阵乘法、梯度等）。所以学深度学习、跟着这些章节学下去才重要。

一层做的事就是：把进来的数字乘上权重再加起来，传给下一层。很多层连在一起，简单信息会逐渐变成「边缘」「眼睛鼻子」「狗/猫」这样的大特征。学习就是不断给正确答案的例子，一点一点调整权重，让输出接近正确答案。「改哪里、改多少」由梯度告诉你，Ch12 会学。

本课程怎么学？ 一层做的事就是乘法和加法的重复。按顺序学：Ch01 内积 → Ch02 矩阵乘法 → Ch03～05 线性层、激活、人工神经元 → Ch06～10 批、连接、隐藏层、深度、宽度 → Ch11～12 softmax 与梯度。

请看下方路线图了解各章内容。从 Ch01 跟着学下来，你就能理解 ChatGPT、自动驾驶这类系统内部用到的数学。