从抛硬币例子理解 Log Loss

1. 问题背景

  • 目标:掷 10 次硬币,前 7 次都是 正面 (heads),后 3 次都是 反面 (tails),才能获胜。
  • 可以选择一枚硬币,其正面概率为 ,反面概率为

示例硬币:

  1. Coin 1:
  2. Coin 2:
  3. Coin 3:

2. 概率计算

胜利概率:

示例:

  • Coin 1:
  • Coin 2:
  • Coin 3:

显然 Coin 1 胜率最高。


3. 优化

方法 1:直接求导

整理因式:

得:

由于 无法获胜,最优


方法 2:取对数简化

记:

求导:

解得:


4. 为什么取对数?

(1) 化乘为加,简化求导

  • 原式是多个概率相乘:
  • 对乘积求导很复杂,尤其是很多项时需要多次用乘法法则(product rule)。
  • 取对数后:
  • 变成加法后,求导只需用链式法则:

(2) 数值稳定性

  • 多个小概率相乘会得到一个极小的数,容易出现 浮点下溢(underflow)
  • 例如,1000 个小于 1 的概率相乘,结果可能接近 ,计算机可能会直接当作 0。
  • 取对数后:
  • 计算机可以轻松处理大负数,避免下溢。

5. 总结

  • 原问题等价于最大化
  • 取对数可大幅简化求导。
  • 最优 ,对应 Coin 1。
  • Log Loss 是分类任务中常用的优化目标函数。