知识花园
Search
搜索
暗色模式
亮色模式
阅读模式
探索
Home
❯
02 Artificial Intelligence
❯
08 Frameworks
❯
Hardware
❯
MindSpeed 训练框架
MindSpeed 训练框架
2026年5月19日
1分钟阅读
CP 是什么并行?
整体的并行策略是?
模型规模:40 层、hidden 4096、ffn 13696、32 head、GQA , GQA是什么?
关系图谱