马尔可夫链可以理解成 “下一步只看现在” 的规则系统。
比如天气:
-
如果今天是晴天,明天有 80% 还是晴天,15% 变多云,5% 下雨
-
如果今天是多云,明天有 45% 晴天,35% 多云,20% 下雨
-
如果今天是下雨,明天有 30% 晴天,40% 多云,30% 下雨
只要你知道今天的天气,就能算出明天的概率,不用去记昨天、前天……
你把这些概率整理成一个表格(转移矩阵),每次乘一下,就能得到“明天的概率分布”。
一直乘下去,最终会收敛到一个长期固定的比例(比如 67% 晴天,22% 多云,11% 下雨),这就是平稳分布,代表很长时间后天气的总体规律。
1. 核心定义
- 马尔可夫链是一系列随机变量:
- 满足马尔可夫性质:
即无记忆性:下一步状态只依赖当前状态,不依赖过去的历史。
2. 状态与转移矩阵
- 状态空间:所有可能的状态集合(有限或可数无限)
- 转移矩阵 :
- 元素
- 列和为 1(列向量表示状态)或行和为 1(行向量表示状态)
天气示例:
3. 状态演化公式
- 当前状态的概率分布(列向量)为 :
- 多步:
4. 平稳分布(Stationary Distribution)
- 当 ,若收敛到 :
- 这是 的特征向量,特征值
- 含义:长期概率分布(不变分布)
5. 分类
- 齐次马尔可夫链(Homogeneous):转移概率不随时间变化
- 非齐次马尔可夫链(Non-Homogeneous):转移概率随时间变化
- 有限状态 / 无限状态
- 可约 / 不可约:是否可以从任一状态到达任一状态
- 周期性 / 非周期性
6. 应用
- PageRank(网页排名)
- 天气预测
- 用户行为分析
- 自然语言模型(N-gram)
- 生物序列建模(DNA、蛋白质)
- 金融市场状态切换