Chapter 00

什么是深度学习?

介绍深度学习是什么,以及 Ch01~Ch12 将学到的内容一览。

按章节的深度学习图示

每完成一章,下方图示会逐步填满。这是目前的结构。

Ch01~Ch12 所学内容

  • Chapter 01
    向量内积

    将两个向量的方向与大小相乘得到一个标量的最基本运算。

  • Chapter 02
    矩阵乘法

    两个矩阵的积由前矩阵的行与后矩阵的列做内积填满新矩阵。

  • Chapter 03
    线性层(权重与偏置)

    对输入乘以权重矩阵并加上偏置的层。

  • Chapter 04
    激活函数(非线性)

    将神经元输出变为非线性的函数。

  • Chapter 05
    人工神经元(加权和与激活)

    计算输入的加权和并施加激活函数的单元。

  • Chapter 06
    批(一次性计算)

    将多个样本一起成批计算的单位。

  • Chapter 07
    权重连接

    层与层、神经元与神经元之间的加权连接。

  • Chapter 08
    隐藏层(看不见的层)

    位于输入层与输出层之间的层。

  • Chapter 09
    深度(深层网络)

    隐藏层多、层数多;即「深度学习」中的「深度」。

  • Chapter 10
    宽度(每层神经元数)

    单层中神经元数量多。

  • Chapter 11
    Softmax(转为概率)

    将向量变为(0,1)内且和为1的概率分布的函数。

  • Chapter 12
    梯度(反向传播)

    参数微调时损失变化的方向与大小。

什么是深度学习?

深度学习是让计算机通过大量例子自己学会规律的一种方法。不是人一条条写规则,而是给它数据,它自己找出「这类输入对应这类输出」。实现这一点的结构叫人工神经网络:像大脑神经元一样的小计算单元,一层层叠起来,就是深度学习

为什么深度学习重要? 我们身边的很多技术都在用。ChatGPTGemini 这类对话和文本生成 AI,特斯拉式的自动驾驶(用摄像头识别车道、行人、信号灯),Netflix、YouTube 的推荐,翻译人脸识别,原理都一样:把输入变成数字,一层层做乘法、加法,得到结果(分类、预测、生成)。实际上,各行各业(IT、医疗、金融、制造等)和学术界里,机器学习、深度学习的研究都占主导

用市面上的高性能模型不行吗? 使用市面上的高性能模型,或者做深度学习、机器学习模型,用氛围编程都能做到。但要把那个模型用好修改活用,就需要这些章节里的基础知识(内积、矩阵乘法、梯度等)。所以学深度学习、跟着这些章节学下去才重要。

一层做的事就是:把进来的数字乘上权重再加起来,传给下一层。很多层连在一起,简单信息会逐渐变成「边缘」「眼睛鼻子」「狗/猫」这样的大特征学习就是不断给正确答案的例子,一点一点调整权重,让输出接近正确答案。「改哪里、改多少」由梯度告诉你,Ch12 会学。

本课程怎么学? 一层做的事就是乘法和加法的重复。按顺序学:Ch01 内积Ch02 矩阵乘法Ch03~05 线性层、激活、人工神经元Ch06~10 批、连接、隐藏层、深度、宽度Ch11~12 softmax 与梯度

请看下方路线图了解各章内容。从 Ch01 跟着学下来,你就能理解 ChatGPT、自动驾驶这类系统内部用到的数学。