张芷铭的个人博客

UNet 通过编码器-解码器结构和跳跃连接实现多层次特征融合,是医学影像分割的基准模型。

模型结构

编码器(收缩路径)

  • 卷积块:两次 3×3 卷积 + BatchNorm + ReLU
  • 池化层:2×2 最大池化,尺寸减半,通道翻倍
  • 示例:输入 572×572,4 次下采样后约 32×32,通道 1024

解码器(扩展路径)

  • 上采样:2×2 反卷积或双线性插值
  • 跳跃连接:拼接编码器高分辨率特征,补充细节
  • 卷积块:两次 3×3 卷积融合高低层信息

输出层

1×1 卷积映射为类别数,Sigmoid 或 Softmax 生成概率图。

训练细节

数据增强

  • 弹性变形、旋转、翻转、缩放
  • 医学数据样本少,增强提升泛化能力

损失函数

Dice Loss

$$\text{Dice Loss} = 1 - \frac{2 \sum y_{\text{pred}} y_{\text{true}}}{\sum y_{\text{pred}} + \sum y_{\text{true}}}$$

适用于小目标分割,可结合交叉熵使用。

优化策略

  • 优化器:Adam 或 SGD with momentum,lr=1e-3~1e-4
  • 早停法:监控验证集损失
  • 正则化:Dropout 或权重衰减

评估指标

  • IoU(交并比)
  • Dice 系数

改进版本

版本改进
UNet++密集跳跃连接,增强多尺度融合
Attention UNet跳跃连接嵌入注意力机制
3D UNet扩展至三维体积数据

Comments