image.png

  • QQ 图 = 检查样本分布 vs 理论分布(常见是正态分布)的工具

  • 横轴:理论分位数(theoretical quantiles, 来自正态分布等)

  • 纵轴:样本分位数(sample quantiles, 来自你的数据)

  • 点点 = 每个分位数对应的散点

  • 参考线 = “理想状态”下应落在的直线(通常是 或平移缩放后的线)


2) 解读方式

  • 点落在直线附近 → 数据分布 ≈ 理论分布(如正态)

  • 点在两端偏离 → 尾部偏离(fat tails / light tails)

  • 整体弯曲 → 偏态(Skewness

    • 向上弯:右偏

    • 向下弯:左偏

  • 一侧点密集 → 分布不对称


3) 为什么要用?

  • 许多模型(线性回归、Logistic 回归、高斯朴素贝叶斯等)假设正态性

  • 直方图看起来像钟形 ≠ 一定正态

  • QQ 图可以更精确地看出是否“贴合”正态分布


4) 步骤

  1. 数据标准化:

  2. 计算样本分位数

  3. 计算相同数量的理论分位数(标准正态)

  4. 画散点图(理论分位数 vs 样本分位数)

  5. 加参考线(通常是 45° 对角线)