- 张芷铭的个人博客

张芷铭的个人博客

📅 0001-01-01

UNet 通过编码器-解码器结构和跳跃连接实现多层次特征融合，是医学影像分割的基准模型。

模型结构

编码器（收缩路径）

卷积块：两次 3×3 卷积 + BatchNorm + ReLU
池化层：2×2 最大池化，尺寸减半，通道翻倍
示例：输入 572×572，4 次下采样后约 32×32，通道 1024

解码器（扩展路径）

上采样：2×2 反卷积或双线性插值
跳跃连接：拼接编码器高分辨率特征，补充细节
卷积块：两次 3×3 卷积融合高低层信息

输出层

1×1 卷积映射为类别数，Sigmoid 或 Softmax 生成概率图。

训练细节

数据增强

弹性变形、旋转、翻转、缩放
医学数据样本少，增强提升泛化能力

损失函数

Dice Loss：

$$\text{Dice Loss} = 1 - \frac{2 \sum y_{\text{pred}} y_{\text{true}}}{\sum y_{\text{pred}} + \sum y_{\text{true}}}$$

适用于小目标分割，可结合交叉熵使用。

优化策略

优化器：Adam 或 SGD with momentum，lr=1e-3~1e-4
早停法：监控验证集损失
正则化：Dropout 或权重衰减

评估指标

IoU（交并比）
Dice 系数

改进版本

版本	改进
UNet++	密集跳跃连接，增强多尺度融合
Attention UNet	跳跃连接嵌入注意力机制
3D UNet	扩展至三维体积数据

Comments