-
QQ 图 = 检查样本分布 vs 理论分布(常见是正态分布)的工具
-
横轴:理论分位数(theoretical quantiles, 来自正态分布等)
-
纵轴:样本分位数(sample quantiles, 来自你的数据)
-
点点 = 每个分位数对应的散点
-
参考线 = “理想状态”下应落在的直线(通常是 或平移缩放后的线)
2) 解读方式
-
点落在直线附近 → 数据分布 ≈ 理论分布(如正态)
-
点在两端偏离 → 尾部偏离(fat tails / light tails)
-
整体弯曲 → 偏态(Skewness)
-
向上弯:右偏
-
向下弯:左偏
-
-
一侧点密集 → 分布不对称
3) 为什么要用?
-
许多模型(线性回归、Logistic 回归、高斯朴素贝叶斯等)假设正态性
-
直方图看起来像钟形 ≠ 一定正态
-
QQ 图可以更精确地看出是否“贴合”正态分布
4) 步骤
-
数据标准化:
-
计算样本分位数
-
计算相同数量的理论分位数(标准正态)
-
画散点图(理论分位数 vs 样本分位数)
-
加参考线(通常是 45° 对角线)