模型部署总览与流程建议¶

当使用 MegEngine 完成模型的训练过程后，为了让模型可以实现它的价值，我们需要对模型进行“部署”，即在特定的硬件设备和系统环境限制下，使用模型进行推理。

根据最终部署设备的不同，我们可能将会经历不同的部署路线：

在下面这张流程图中，可以了解到不同部署路线中的几个基本步骤：

注解

为了更好的选择模型部署，需要了解到以下几点：

最推荐的路线为训练代码 -> .tm 文件 -> .mge 文件 -> Lite 执行；
如果你的团队中存在研究员 / 工程人员的分工，建议以 .tm 文件做为分界面 —— 研究员负责交付 .tm 模型（永久存档），工程人员负责后续的部署流程；
如果你独立负责完整的训练到部署过程，且不在意长期存档模型。为了快捷，可以直接从训练代码生成 .mge 文件（即上述虚线），结果是等价的。

参见

使用 XLA 作为编译后端加速模型训练

使用 MegEngine Lite 部署模型