[5分钟深度学习] #02 反向传播算法_哔哩哔哩_bilibili

链式法则与反向传播推导

1. 线性回归中的链式法则推导

1.1 结构关系

  • 依赖于
  • 依赖于

1.2 公共部分

对所有参数:

因为 ,求导得到

1.3 各参数的局部导数

1.4 梯度公式

结合链式法则:

1.5 参数更新(梯度下降)

其中 为学习率。


2. 损失函数与优化目标

2.1 模型目标

  • 找到最佳
  • 使预测 与真实值 的误差最小
  • 误差度量:均方误差(MSE)

2.2 均方误差

对于数据集

其中:

2.3 梯度下降法


3. 多层神经网络的反向传播

3.1 网络结构

  • 输入层:
  • 隐藏层 1:
  • 隐藏层 2:
  • 输出层:

3.2 损失函数(Log Loss)

3.3 反向传播步骤

输出层:

隐藏层 2:

隐藏层 1:

3.4 参数更新