知识花园

Home

❯

02 Artificial Intelligence

❯

04 Large Language Models

❯

Optimization

文件夹: 02-Artificial-Intelligence/04-Large-Language-Models/Optimization

此文件夹下有11条笔记。

  • 2026年5月25日

    Speculative Decoding:打破大模型推理的速度枷锁

    • 2026年3月25日

      全量激活重计算

      • 2026年3月25日

        vLLM使用指南:大模型高吞吐推理的事实标准

        • 2026年3月25日

          Prefill 阶段

          • 2026年3月25日

            训推一致(Train-Inference Consistency):从入门到硬核原理全解析

            • 2026年3月25日

              大模型吞吐优化

              • 2026年3月25日

                LLM推理性能终极标尺:MFU 深度解析、计算方法与2nd Forward FLOPs全拆解

                • 2026年3月25日

                  吞吐优化的核心技术体系

                  • 2026年3月25日

                    VLM推理MFU两大常见误区澄清

                    • 2026年3月25日

                      常见 MFU

                      • 2026年2月26日

                        SGLang:大模型结构化生成语言与推理框架


                        Created with Quartz v4.5.2 © 2026

                        • GitHub
                        • Discord Community