从抛硬币例子理解 Log Loss
1. 问题背景
- 目标:掷 10 次硬币,前 7 次都是 正面 (heads),后 3 次都是 反面 (tails),才能获胜。
- 可以选择一枚硬币,其正面概率为 ,反面概率为 。
示例硬币:
- Coin 1:,
- Coin 2:
- Coin 3:
2. 概率计算
胜利概率:
示例:
- Coin 1:
- Coin 2:
- Coin 3:
显然 Coin 1 胜率最高。
3. 优化
方法 1:直接求导
整理因式:
解 得:
由于 无法获胜,最优 。
方法 2:取对数简化
对 取 :
记:
求导:
解得:
4. 为什么取对数?
(1) 化乘为加,简化求导
- 原式是多个概率相乘:
- 对乘积求导很复杂,尤其是很多项时需要多次用乘法法则(product rule)。
- 取对数后:
- 变成加法后,求导只需用链式法则:
(2) 数值稳定性
- 多个小概率相乘会得到一个极小的数,容易出现 浮点下溢(underflow)。
- 例如,1000 个小于 1 的概率相乘,结果可能接近 ,计算机可能会直接当作 0。
- 取对数后:
- 计算机可以轻松处理大负数,避免下溢。
5. 总结
- 原问题等价于最大化 。
- 取对数可大幅简化求导。
- 最优 为 ,对应 Coin 1。
- Log Loss 是分类任务中常用的优化目标函数。