Files
obsidian/projects/auto-tuner/Roadmap.md

318 B
Raw Permalink Blame History

我们的目标:

对上向模型提供一套抽象 IR能够以接近 0 成本的方式适配新模型,将模型编译至 IR.

针对我们定义的 IR可以在 IR 层面对模型的分布式部署策略、推理负载动态性等做抽象的优化,得到优化方案适配不同的后端推理框架。