假设检验的效能(Power of a Test)
1. 错误类型
- 第一类错误(Type I error, α):拒绝了原假设 ,但 实际为真。
- 第二类错误(Type II error, β):没有拒绝原假设 ,但 实际为假。
2. 效能(Power)
- 定义:在 不成立时,正确拒绝 的概率。
- 公式:
3. 关系
- Power 越大,说明检验越有能力识别出真实的效应。
- 增加 Power 的方法:
- 增加样本量 n:减小标准误差,提高区分能力。
- 提高显著性水平 α:放宽拒绝 的标准(但会增大 Type I error)。
- 效应量(Effect size)越大:即真实均值与 下的均值差距越大,越容易被检出。
4. 直观解释
- α:过于谨慎导致“假阳性”。
- β:过于保守导致“假阴性”。
- Power (1-β):能正确发现差异的“眼力”。
5. 图形理解
- 横轴:真实总体均值 μ。
- 纵轴:拒绝 的概率。
- 当 μ 越远离 假定的值时,Power 越接近 1。
- Power 曲线随 α 的增加整体上移。