- 张芷铭的个人博客

TAESD 是 Stable Diffusion 原始 VAE 的微型蒸馏版本，通过大幅减少参数量（编码器/解码器均降至 122 万参数）实现高效编码解码，适合实时预览和资源受限场景。

模型定位

TAESD（Tiny Autoencoder for Stable Diffusion）是专为 Stable Diffusion 潜在空间设计的轻量级自编码器，兼容 SD1/2、SDXL、SD3 等多种变体。

组件	功能
编码器	将全尺寸图像压缩为潜在表示（48 倍有损压缩），形状 `4x(H/8)x(W/8)`，值范围 `[-3, 3]`
解码器	从潜在表示重建图像，输出形状 `3xHxW`，值范围 `[0, 1]`

结构基于卷积层、ReLU 激活和上采样层，注重速度而非细节精度。

若需高质量输出，仍需依赖原始 VAE 或 OpenAI Consistency Decoder。