1. 基本定义
二项分布用于描述如下类型的实验:
- 重复进行 次 Bernoulli Distribution 实验
- 每次实验只有 两个结果(成功/失败)
- 每次实验的成功概率是
- 目标变量 是“成功的次数”
我们记作:
2. 场景直觉(以抛硬币为例)
抛 5 次硬币,问出现 2 次正面的概率是多少?
- 每个序列(如:HTHTT)出现的概率都是
- 出现 2 个正面的序列总共有 10 种
- 所以:
3. 一般公式(PMF)
**概率质量函数(PMF)**如下:
其中:
- 是 Binomial Coefficient:“从 次实验中取 次成功”
- 是成功的概率
- 是失败的概率
4. 示例图像与对称性
✅ 如果 (公平硬币):
- 分布是对称的
- 最大值出现在
⚠️ 如果 :
- 分布是偏斜的(skewed)
- 比如 ,更偏向 0 附近(成功次数少)
7. 常见性质总结
- 期望:
- 方差:
📐 二项分布的期望与方差推导
🎯 设定
设 ,表示进行 次独立伯努利试验(每次成功概率 ), 是成功次数。
我们可以将 拆成 个独立的 0-1 伯努利变量之和:
🧮 期望(Expectation)
利用期望的线性性:
对于伯努利变量:
所以:
📊 方差(Variance)
利用独立变量方差可加性:
对于伯努利变量:
所以: