神经网络按”输入形态 + 任务类型”分八大类。FNN 为基础;CNN 处理图像/视频;RNN/LSTM 处理短序列;Transformer 取代 RNN 成为序列与多模态的统一架构;GAN/VAE/AE 负责生成与压缩;GNN 处理图结构数据。
八大类型速查
| 类型 | 核心 | 主要用途 |
|---|---|---|
| FNN(MLP) | 信息单向流动,最基础 | 静态分类/回归、复杂网络的子模块 |
| CNN | 局部连接、权值共享 | 图像分类、检测、医学影像 |
| RNN(LSTM/GRU) | 隐藏状态记忆历史 | 短序列建模、语音识别 |
| AE / VAE | 编码-解码压缩还原 | 数据压缩、去噪、异常检测、生成 |
| GAN | 生成器与判别器对抗 | 图像生成、风格迁移、超分辨率 |
| GNN | 邻居聚合更新节点 | 社交网络、分子设计、推荐 |
| Transformer | 自注意力,长距离依赖 | NLP、CV(ViT)、多模态、大模型 |
| 混合架构 | 多种网络组合 | 图文、跨模态任务 |
各类型核心要点
FNN(前馈神经网络)
信息单向:输入 → 隐藏 → 输出。代表是 MLP,所有复杂网络的基础组件。适合表格数据的回归/分类。
CNN(卷积神经网络)
通过卷积核滑动提取局部特征,权值共享与平移不变性是关键。代表:LeNet、AlexNet、ResNet、EfficientNet。
RNN / LSTM / GRU
带记忆的序列网络。原始 RNN 因梯度消失记不住长依赖,LSTM/GRU 通过门控解决。在 Transformer 之后地位下降,但在嵌入式与流式场景仍有应用。
AE / VAE
- AE:编码器将输入压缩到低维潜空间,解码器还原;用于压缩、去噪、异常检测
- VAE:在潜空间引入概率分布约束,可生成连续样本,是扩散模型之前的主流生成方法之一
GAN
生成器造假、判别器辨真,对抗训练直至生成器以假乱真。代表:StyleGAN、Pix2Pix、CycleGAN。痛点:训练不稳定、模式崩溃。
GNN(图神经网络)
处理”节点 + 边”结构。每个节点通过聚合邻居信息更新自己的表示。代表:GCN、GAT、GraphSAGE。
Transformer
自注意力允许任意两 token 直接交互,无需循环即可建模长距离依赖。已成为 NLP(BERT、GPT)、CV(ViT、DiT)、多模态(CLIP、Flamingo)、大模型(LLaMA、GPT-4)的统一架构。
混合架构
| 组合 | 典型任务 |
|---|---|
| CNN + RNN | 图像字幕生成 |
| CNN + Transformer | ViT 衍生、视觉语言模型 |
| AE + GAN | 高保真图像生成 |
| Diffusion + Transformer(DiT) | 现代图像/视频生成 |
选型对照
| 任务 | 推荐 |
|---|---|
| 表格分类/回归 | FNN(MLP) |
| 图像识别、检测 | CNN、ViT |
| 文本生成、问答、翻译 | Transformer(GPT/BERT) |
| 短序列、流式 | LSTM / GRU |
| 图像生成、超分辨率 | Diffusion / GAN / VAE |
| 社交网络、分子、推荐 | GNN(GCN/GAT) |
| 数据压缩、去噪、异常检测 | AE / DAE |