从抛硬币例子理解 Log Loss

1. 问题背景

目标：掷 10 次硬币，前 7 次都是正面 (heads)，后 3 次都是反面 (tails)，才能获胜。
可以选择一枚硬币，其正面概率为 $p$ ，反面概率为 $1 - p$ 。

示例硬币：

Coin 1： $p = 0.7$ ， $1 - p = 0.3$
Coin 2： $p = 0.5$
Coin 3： $p = 0.3$

2. 概率计算

胜利概率：

g (p) = p^{7} (1 - p)^{3}

示例：

Coin 1: $0. 7^{7} \times 0. 3^{3} \approx 0.00222$
Coin 2: $0. 5^{10} \approx 0.000976$
Coin 3: $0. 3^{7} \times 0. 7^{3} \approx 0.000082$

显然 Coin 1 胜率最高。

3. 优化 $p$

方法 1：直接求导

g^{'} (p) = 7 p^{6} (1 - p)^{3} + p^{7} \cdot 3 (1 - p)^{2} (- 1)

整理因式：

g^{'} (p) = p^{6} (1 - p)^{2} [7 (1 - p) - 3 p]

解 $g^{'} (p) = 0$ 得：

p = 0, p = 1, p = 0.7

由于 $p = 0, 1$ 无法获胜，最优 $p = 0.7$ 。

方法 2：取对数简化

对 $g (p)$ 取 $lo g$ ：

lo g g (p) = 7 lo g p + 3 lo g (1 - p)

记：

G (p) = 7 lo g p + 3 lo g (1 - p)

求导：

G^{'} (p) = \frac{7}{p} - \frac{3}{1 - p} = 0

解得：

7 (1 - p) - 3 p = 0 \Rightarrow p = 0.7

4. 为什么取对数？

(1) 化乘为加，简化求导

原式是多个概率相乘：

p^{7} (1 - p)^{3}

对乘积求导很复杂，尤其是很多项时需要多次用乘法法则（product rule）。
取对数后：

lo g L (p) = 7 lo g p + 3 lo g (1 - p)

变成加法后，求导只需用链式法则：

\frac{d}{d p} lo g L (p) = \frac{7}{p} - \frac{3}{1 - p}

(2) 数值稳定性

多个小概率相乘会得到一个极小的数，容易出现 浮点下溢（underflow）。
例如，1000 个小于 1 的概率相乘，结果可能接近 $1 0^{- 300}$ ，计算机可能会直接当作 0。
取对数后：

lo g (很小的数) = 很大的负数

计算机可以轻松处理大负数，避免下溢。

5. 总结

原问题等价于最大化 $p^{7} (1 - p)^{3}$ 。
取对数可大幅简化求导。
最优 $p$ 为 $0.7$ ，对应 Coin 1。
Log Loss 是分类任务中常用的优化目标函数。

My Notes

Explorer

Log Loss

从抛硬币例子理解 Log Loss

1. 问题背景

2. 概率计算

3. 优化 $p$

方法 1：直接求导

方法 2：取对数简化

4. 为什么取对数？

(1) 化乘为加，简化求导

(2) 数值稳定性

5. 总结

Graph View

Table of Contents

Backlinks

My Notes

Explorer

Log Loss

从抛硬币例子理解 Log Loss

1. 问题背景

2. 概率计算

3. 优化 p

方法 1：直接求导

方法 2：取对数简化

4. 为什么取对数？

(1) 化乘为加，简化求导

(2) 数值稳定性

5. 总结

Graph View

Table of Contents

Backlinks

3. 优化 $p$