前向传播从输入计算输出，反向传播用链式法则求梯度，二者构成神经网络训练的核心循环。

核心概念

前向传播

从输入出发，沿计算流程正向计算到输出，同时记录中间结果。

输入 $x=2$，参数 $w=3$，$b=1$：

$$y_{pred} = w \cdot x + b = 3 \times 2 + 1 = 7$$

损失（$y_{true}=8$，MSE）：

$$L = \frac{1}{2}(y_{pred} - y_{true})^2 = 0.5$$

输入 $x=[1, 2]$ → 隐藏层 → 输出层：

从损失出发，反向求导，计算每个参数的梯度。

若 $y = f(g(x))$，则：

$$\frac{dy}{dx} = \frac{dy}{dg} \times \frac{dg}{dx}$$

求 $\frac{dL}{dw}$、$\frac{dL}{db}$：

梯度下降更新（$lr=0.1$）：

$$w = w - lr \cdot \frac{dL}{dw} = 3 - 0.1 \times (-2) = 3.2$$

1
初始化参数 → 前向传播 → 计算损失 → 反向传播 → 更新参数 → 循环