Files
obsidian/phd/research/MoE/Base.md

207 B
Raw Blame History

MoE 提供的 sys 可做的点(现有的工作分类):

  • expert offloading通过在显存上只保存需要被激活的 expert来大大降低显存需求实现消费级显卡运行大模型。