- 张芷铭的个人博客

主流生成式大模型（GPT、LLaMA、Claude、Qwen）全部采用纯Decoder架构，Encoder对生成任务纯冗余。

架构对比

架构	特点	适用场景
Encoder-Decoder	编码器理解+解码器生成	机器翻译、摘要
纯Decoder	自回归逐词生成	通用生成任务

Encoder未消失，转战理解类任务：

纯Decoder完美匹配生成需求：流畅生成、低成本训练、全场景通用。Encoder在通用大模型中是冗余配件。