Files
obsidian/period/weekly/25/0303-0309.md

685 B
Raw Permalink Blame History

  • 调研企业级私有化部署 DeepSeek 的机会
    • llama.cpp 有什么问题?是不是只适合单机?
    • ktransformer 相比 llama.cpp 为什么有优势?他们是不是只 focus 在单机?企业级部署不像个人使用,提供 global scheduler 后跟多个单机跑有什么问题?分布式并行跑有什么问题?
    • M2 Ultra 这种 unified memory 芯片有提供低成本部署的机会吗?
      • 机会点计算很可能在往稀疏性发展MoE 等。m 系列芯片这种内存大算力一般的芯片可能具有一定优势
      • m 系列芯片互联带宽在 1040Gb 之间(相比 450Gb+ 的 NVLink会不会成为 bottleneck