1. 从一维到多维
-
一维高斯分布(Univariate Gaussian):
-
多维高斯分布(Multivariate Gaussian):考虑 个变量
- :随机向量
- :均值向量
- :协方差矩阵(对称、半正定)
2. 独立 vs 相关
- 独立情况: 为对角阵
- 各变量互不影响,等高线是圆(二维情况)
- 相关情况: 有非零的非对角元素
- 各变量存在线性相关性,等高线拉长为椭圆
3. 协方差矩阵的作用
- 控制分布的形状:
- 对角线元素:每个变量的方差
- 非对角线元素:变量间的协方差
- (行列式):控制“体积”/扩散范围
- 越大 → 分布越“平坦”,越分散
- 越小 → 分布越“尖锐”,越集中
Q:为什么各变量存在线性相关性,等高线拉长为椭圆
1. 独立情况(圆形/标准椭圆)
如果 独立:
- 协方差矩阵:
- 二次型:
- 这是一个椭圆方程。当 时为圆,否则是轴对齐的椭圆。
2. 存在线性相关性(椭圆旋转)
当 有相关性:
- 协方差矩阵:
- 二次型: 由于 (存在协方差项),曲线会产生旋转项 → 等高线是旋转后的椭圆。
3. 椭圆为什么会拉长?
- 协方差 : 增大时 也倾向增大 → 数据点沿 正斜率方向 分布更宽 → 椭圆主轴朝 方向。
- 协方差 : 增大时 倾向减小 → 数据点沿 负斜率方向 分布更宽 → 椭圆主轴朝 方向。
- 本质:协方差矩阵的特征向量决定椭圆的方向,特征值决定长短轴大小。