Chapter 03

对数函数：从乘法到加法，损失设计的语言

对数表示「底乘几次能得到这个数」，是指数的逆运算，在深度学习的损失与概率式中与指数一起使用。

按章节的数学图示

选择章节后，下方图示会切换为该章节内容。可一览基础数学的脉络。

对数是指数的逆。 $y = \log_2 x$ 表示 $2^y = x$ 。下图为 $y = \log_2 x$ 与其反函数 $y = 2^x$ 的图象。

例： $\log_2 1 = 0$ ， $\log_2 2 = 1$ ， $\log_2 4 = 2$ ， $\log_2 8 = 3$ （当 $2^y = x$ 时， $y$ 即为 $\log_2 x$ ）

紫： $y=\log_2 x$ ，青绿： $y=2^x$

什么是对数函数

对数相当于「把指数的时间倒着走」。在

2^3 = 8

里，看到结果 8 问「2 乘了几次才得到 8？」这个次数就是对数

\log_2 8 = 3

。其中 2 是底，8 是真数。

可以想成「数位数」。

100 = 10^2

所以

\log_{10} 100 = 2

，

1000 = 10^3

所以

\log_{10} 1000 = 3

。数扩大 10 倍（

\times 10

），对数值只增加 1（

+1

）。也就是说，对数把急剧变大的数压成平缓变化的过滤器。基本性质：

\log_a 1 = 0

（底乘 0 次得 1），

\log_a a = 1

（底乘 1 次得自己）。

对数的妙处在于「把乘法变成加法」：

\log_a(b \times c) = \log_a b + \log_a c

。在计算机里乘法比加法贵，数也容易溢出或下溢，取对数后复杂的乘积会变成简单、稳定的加法。

真数必须 $x>0$ 。0 或负数的对数没有定义，所以 AI 代码里常加一个很小的数

\epsilon

避免

\log(0)

报错。以

e

为底的自然对数 $\ln$ 则让求导形式简洁，是深度学习里的标准选择。

因为必须防止下溢。把概率

0.1

连乘 100 次得到

0.1^{100}

，计算机会当成「小到无法表示的 0」。取对数后

\log(0.1^{100}) = 100 \times \log(0.1) = -100

，就仍是有意义的数。

因为它是信息量（熵）的尺子。概率越低（越罕见），对数值的绝对值越大。「明天太阳从西边出来」这种罕见事件信息量大，「明天早上会天亮」这种必然事件信息量接近 0。AI 用基于对数的信息量衡量「学到了多令人惊讶的信息」。

因为对错误施以重罚。

y=\ln x

（

0<x<1

）的图像中，

x

趋近 0 时

y

趋近

-\infty

。预测正确类概率为 0.9 时损失很小，若误预测为 0.01，对数会暴增，产生巨大惩罚（损失），促使模型明显纠正错误。

交叉熵损失是典型用法：对正确类的概率取对数再取负（

-\log p

）并最小化，相当于数学上要求「把正确类的概率尽量推向 1（对数尽量接近 0）」。

最大似然估计（MLE）里会用到。「让观测到这批数据的概率最大」等于让很多概率的积最大；取对数后变成让和最大，便于求导且数值更稳定。

例 $\log_2 8$
值 $2^3=8$

例 $\log_2 4$
值 $2$

例 $\log_3 9$
值 $2$

例	值
$\log_2 8$	3（ $2^3=8$ ）
$\log_2 4$	2
$\log_3 9$	2

仅当真数是底的整数次幂时，对数值才是整数。

对数中常用运算（在 AI 损失与概率式中常用）：

运算 $对数和$
公式 $\log_a b + \log_a c = \log_a(b \cdot c)$
说明 $积\to和$

运算 $对数差$
公式 $\log_a b - \log_a c = \log_a(b/c)$
说明 $商\to差$

运算 $幂$
公式 $\log_a(b^n) = n \cdot \log_a b$
说明 $指数提前$

运算	公式	说明
对数和	$\log_a b + \log_a c = \log_a(b \cdot c)$	积→和
对数差	$\log_a b - \log_a c = \log_a(b/c)$	商→差
幂	$\log_a(b^n) = n \cdot \log_a b$	指数提前

例 $对数和$
计算 $\log_2 2 + \log_2 4 = 1 + 2 = 3$

例 $对数差$
计算 $\log_2 8 - \log_2 2 = 3 - 1 = 2$

例	计算
对数和	$\log_2 2 + \log_2 4 = 1 + 2 = 3$
对数差	$\log_2 8 - \log_2 2 = 3 - 1 = 2$