知识花园

❯

02 Artificial Intelligence

❯

02 Deep Learning

❯

文件夹: 02-Artificial-Intelligence/02-Deep-Learning/Training

此文件夹下有23条笔记。

2026年5月25日
什么是学习率预热？大白话讲懂AI训练必备技巧
2026年5月06日
模型训练：Ulysses Sequence Parallel 通俗解析
2026年5月06日
模型训练：FSDP 通俗解析（不废话版）
2026年4月13日
模型训练：专家并行（通俗易懂版）
2026年4月13日
前向传播与反向传播详解
2026年4月09日
Xavier 初始化
2026年3月25日
基于人类反馈的强化学习（RLHF）：让大语言模型与人类价值观对齐的关键技术
2026年3月25日
在一个batch内网络参数是如何优化的？
2026年3月25日
归纳偏置 inductive biases
2026年3月25日
MLP训练经验
2026年3月25日
SM 流式处理器
2026年3月25日
多尺度监督
2026年3月25日
渐进式蒸馏
2026年3月25日
自回归 auto regressive
2026年3月25日
蒸馏投影层（Projection Layers for Distillation）
2026年3月16日
Adam算法全解：从数学原理到工业界最佳实践
2026年3月13日
RL实操学习路线
2026年2月26日
Simple Projection Layers 的定义与运算
2026年2月26日
masked auto-regression (MAR)
2026年2月26日
self-forcing
2026年2月26日
嵌套表示学习
2026年2月26日
嵌套表示学习（MRL）：从理论到实践
2026年2月26日
常见精度

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community