318 B
318 B
我们的目标:
对上向模型提供一套抽象 IR,能够以接近 0 成本的方式适配新模型,将模型编译至 IR.
针对我们定义的 IR,可以在 IR 层面对模型的分布式部署策略、推理负载动态性等做抽象的优化,得到优化方案适配不同的后端推理框架。
我们的目标:
对上向模型提供一套抽象 IR,能够以接近 0 成本的方式适配新模型,将模型编译至 IR.
针对我们定义的 IR,可以在 IR 层面对模型的分布式部署策略、推理负载动态性等做抽象的优化,得到优化方案适配不同的后端推理框架。