1. 从一维到多维

  • 一维高斯分布(Univariate Gaussian):

  • 多维高斯分布(Multivariate Gaussian):考虑 个变量

    • :随机向量
    • :均值向量
    • :协方差矩阵(对称、半正定)

2. 独立 vs 相关

  • 独立情况 为对角阵
    • 各变量互不影响,等高线是圆(二维情况)
  • 相关情况 有非零的非对角元素
    • 各变量存在线性相关性,等高线拉长为椭圆

3. 协方差矩阵的作用

  • 控制分布的形状:
    • 对角线元素:每个变量的方差
    • 非对角线元素:变量间的协方差
  • (行列式):控制“体积”/扩散范围
    • 越大 → 分布越“平坦”,越分散
    • 越小 → 分布越“尖锐”,越集中

Q:为什么各变量存在线性相关性,等高线拉长为椭圆

1. 独立情况(圆形/标准椭圆)

如果 独立:

  • 协方差矩阵:
  • 二次型:
  • 这是一个椭圆方程。当 时为圆,否则是轴对齐的椭圆。

2. 存在线性相关性(椭圆旋转)

有相关性:

  • 协方差矩阵:
  • 二次型: 由于 (存在协方差项),曲线会产生旋转项 → 等高线是旋转后的椭圆

3. 椭圆为什么会拉长?

  • 协方差 增大时 也倾向增大 → 数据点沿 正斜率方向 分布更宽 → 椭圆主轴朝 方向。
  • 协方差 增大时 倾向减小 → 数据点沿 负斜率方向 分布更宽 → 椭圆主轴朝 方向。
  • 本质:协方差矩阵的特征向量决定椭圆的方向,特征值决定长短轴大小。