知识花园
Search
搜索
暗色模式
亮色模式
探索
Home
❯
02 Artificial Intelligence
❯
04 Large Language Models
❯
Optimization
文件夹: 02-Artificial-Intelligence/04-Large-Language-Models/Optimization
此文件夹下有11条笔记。
2026年5月25日
Speculative Decoding:打破大模型推理的速度枷锁
2026年3月25日
全量激活重计算
2026年3月25日
vLLM使用指南:大模型高吞吐推理的事实标准
2026年3月25日
Prefill 阶段
2026年3月25日
训推一致(Train-Inference Consistency):从入门到硬核原理全解析
2026年3月25日
大模型吞吐优化
2026年3月25日
LLM推理性能终极标尺:MFU 深度解析、计算方法与2nd Forward FLOPs全拆解
2026年3月25日
吞吐优化的核心技术体系
2026年3月25日
VLM推理MFU两大常见误区澄清
2026年3月25日
常见 MFU
2026年2月26日
SGLang:大模型结构化生成语言与推理框架