当你想比较样本的均值和某个假设的总体均值(或两个样本的均值差异)时,但 总体标准差 不知道,就要用 t 分布来代替正态分布。
📌 常见的 t 检验类型
1. 单样本 t 检验(One-sample t-test)
- 问题:一个样本的均值 是否等于某个假设均值 ?
- 统计量:
- 例子:某药物治疗后的平均血压是否等于 120 mmHg?
2. 独立样本 t 检验(Independent two-sample t-test)
- 问题:两个 独立样本 的均值是否相等?
- 统计量(假设方差相等): 其中 是合并标准差(pooled standard deviation)。
- 例子:男生和女生的平均成绩是否有显著差异?
3. 配对样本 t 检验(Paired t-test)
- 问题:同一组对象在两种条件下的均值差异是否显著?
- 做法:把“差值”当作新样本,转化为单样本 t 检验。
- 例子:同一批病人治疗前后的血糖差异。
Two-Sample t-Test 举例
🎯 背景
比较两个总体均值是否有差异,例如:
- 美国 18 岁人群身高
- 阿根廷 18 岁人群身高
样本数据:
- 美国:,,
- 阿根廷:,,
📌 假设
- 原假设 :
- 备择假设 :
- 单尾: 或
- 双尾:
📊 检验统计量
因为总体标准差未知,用样本标准差替代:
🔑 自由度 (Welch’s t-test)
如果两组方差不同,自由度用近似公式:
这里结果
🧮 计算结果
- 统计量:
单尾检验 ()
- p 值 = 0.0495 < 0.05
✅ 拒绝 ,认为美国均值更高。
双尾检验 ()
- p 值 = 0.0991 > 0.05
❌ 不能拒绝 ,没有显著差异证据。
Paired t-Test 举例
📌 核心思想
当我们有 两组相关样本(同一对象在两种条件下的观测值,比如治疗前/治疗后),就可以用配对 t 检验。
关键做法:
把两组数据的差值 当作一个新样本,转化为 单样本 t 检验。
📊 统计量公式
- 差值的样本均值:
- 差值的样本标准差:
- t 统计量:
其中:
- = 理论差值均值,在 下通常取 0(即无差异)。
- 自由度:
📍 假设检验
- 零假设 :(两组均值无差异)
- 备择假设 :
- 单尾检验: 或
- 双尾检验:
📝 示例
- 场景:检验训练计划是否能减肥
- 数据:每个人训练前后的体重,
- 计算结果:
- ,自由度
- p 值 = 0.0227 < 0.05
➡ 结论:拒绝 ,认为训练有效。