知识花园

Home

❯

02 Artificial Intelligence

❯

02 Deep Learning

❯

Training

文件夹: 02-Artificial-Intelligence/02-Deep-Learning/Training

此文件夹下有23条笔记。

  • 2026年5月25日

    什么是学习率预热?大白话讲懂AI训练必备技巧

    • 2026年5月06日

      模型训练:Ulysses Sequence Parallel 通俗解析

      • 2026年5月06日

        模型训练:FSDP 通俗解析(不废话版)

        • 2026年4月13日

          模型训练:专家并行(通俗易懂版)

          • 2026年4月13日

            前向传播与反向传播详解

            • 深度学习
            • 神经网络
            • 训练算法
          • 2026年4月09日

            Xavier 初始化

            • 2026年3月25日

              基于人类反馈的强化学习(RLHF):让大语言模型与人类价值观对齐的关键技术

              • 2026年3月25日

                在一个batch内网络参数是如何优化的?

                • 2026年3月25日

                  归纳偏置 inductive biases

                  • 2026年3月25日

                    MLP训练经验

                    • 2026年3月25日

                      SM 流式处理器

                      • 2026年3月25日

                        多尺度监督

                        • 2026年3月25日

                          渐进式蒸馏

                          • 2026年3月25日

                            自回归 auto regressive

                            • 2026年3月25日

                              蒸馏投影层(Projection Layers for Distillation)

                              • 2026年3月16日

                                Adam算法全解:从数学原理到工业界最佳实践

                                • 2026年3月13日

                                  RL实操学习路线

                                  • 2026年2月26日

                                    Simple Projection Layers 的定义与运算

                                    • ai
                                    • deep-learning
                                    • machine-learning
                                  • 2026年2月26日

                                    masked auto-regression (MAR)

                                    • ai
                                    • deep-learning
                                    • machine-learning
                                  • 2026年2月26日

                                    self-forcing

                                    • ai
                                    • deep-learning
                                    • machine-learning
                                  • 2026年2月26日

                                    嵌套表示学习

                                    • 2026年2月26日

                                      嵌套表示学习(MRL):从理论到实践

                                      • 2026年2月26日

                                        常见精度

                                        • 数值精度
                                        • 深度学习
                                        • 量化
                                        • 模型部署

                                      Created with Quartz v4.5.2 © 2026

                                      • GitHub
                                      • Discord Community