Chapter 00
什么是深度学习?
介绍深度学习是什么,以及 Ch01~Ch12 将学到的内容一览。
按章节的深度学习图示
每完成一章,下方图示会逐步填满。这是目前的结构。
Ch01~Ch12 所学内容
- Chapter 01向量内积
将两个向量的方向与大小相乘得到一个标量的最基本运算。
- Chapter 02矩阵乘法
两个矩阵的积由前矩阵的行与后矩阵的列做内积填满新矩阵。
- Chapter 03线性层(权重与偏置)
对输入乘以权重矩阵并加上偏置的层。
- Chapter 04激活函数(非线性)
将神经元输出变为非线性的函数。
- Chapter 05人工神经元(加权和与激活)
计算输入的加权和并施加激活函数的单元。
- Chapter 06批(一次性计算)
将多个样本一起成批计算的单位。
- Chapter 07权重连接
层与层、神经元与神经元之间的加权连接。
- Chapter 08隐藏层(看不见的层)
位于输入层与输出层之间的层。
- Chapter 09深度(深层网络)
隐藏层多、层数多;即「深度学习」中的「深度」。
- Chapter 10宽度(每层神经元数)
单层中神经元数量多。
- Chapter 11Softmax(转为概率)
将向量变为(0,1)内且和为1的概率分布的函数。
- Chapter 12梯度(反向传播)
参数微调时损失变化的方向与大小。
什么是深度学习?
深度学习是让计算机通过大量例子自己学会规律的一种方法。不是人一条条写规则,而是给它数据,它自己找出「这类输入对应这类输出」。实现这一点的结构叫人工神经网络:像大脑神经元一样的小计算单元,一层层叠起来,就是深度学习。
为什么深度学习重要? 我们身边的很多技术都在用。ChatGPT、Gemini 这类对话和文本生成 AI,特斯拉式的自动驾驶(用摄像头识别车道、行人、信号灯),Netflix、YouTube 的推荐,翻译,人脸识别,原理都一样:把输入变成数字,一层层做乘法、加法,得到结果(分类、预测、生成)。实际上,各行各业(IT、医疗、金融、制造等)和学术界里,机器学习、深度学习的研究都占主导。
用市面上的高性能模型不行吗? 使用市面上的高性能模型,或者做深度学习、机器学习模型,用氛围编程都能做到。但要把那个模型用好、修改或活用,就需要这些章节里的基础知识(内积、矩阵乘法、梯度等)。所以学深度学习、跟着这些章节学下去才重要。
一层做的事就是:把进来的数字乘上权重再加起来,传给下一层。很多层连在一起,简单信息会逐渐变成「边缘」「眼睛鼻子」「狗/猫」这样的大特征。学习就是不断给正确答案的例子,一点一点调整权重,让输出接近正确答案。「改哪里、改多少」由梯度告诉你,Ch12 会学。
本课程怎么学? 一层做的事就是乘法和加法的重复。按顺序学:Ch01 内积 → Ch02 矩阵乘法 → Ch03~05 线性层、激活、人工神经元 → Ch06~10 批、连接、隐藏层、深度、宽度 → Ch11~12 softmax 与梯度。
请看下方路线图了解各章内容。从 Ch01 跟着学下来,你就能理解 ChatGPT、自动驾驶这类系统内部用到的数学。