UNet 通过编码器-解码器结构和跳跃连接实现多层次特征融合,是医学影像分割的基准模型。
模型结构
编码器(收缩路径)
- 卷积块:两次 3×3 卷积 + BatchNorm + ReLU
- 池化层:2×2 最大池化,尺寸减半,通道翻倍
- 示例:输入 572×572,4 次下采样后约 32×32,通道 1024
解码器(扩展路径)
- 上采样:2×2 反卷积或双线性插值
- 跳跃连接:拼接编码器高分辨率特征,补充细节
- 卷积块:两次 3×3 卷积融合高低层信息
输出层
1×1 卷积映射为类别数,Sigmoid 或 Softmax 生成概率图。
训练细节
数据增强
- 弹性变形、旋转、翻转、缩放
- 医学数据样本少,增强提升泛化能力
损失函数
Dice Loss:
$$\text{Dice Loss} = 1 - \frac{2 \sum y_{\text{pred}} y_{\text{true}}}{\sum y_{\text{pred}} + \sum y_{\text{true}}}$$
适用于小目标分割,可结合交叉熵使用。
优化策略
- 优化器:Adam 或 SGD with momentum,lr=1e-3~1e-4
- 早停法:监控验证集损失
- 正则化:Dropout 或权重衰减
评估指标
- IoU(交并比)
- Dice 系数
改进版本
| 版本 | 改进 |
|---|---|
| UNet++ | 密集跳跃连接,增强多尺度融合 |
| Attention UNet | 跳跃连接嵌入注意力机制 |
| 3D UNet | 扩展至三维体积数据 |
张芷铭的个人博客
Comments