Skip to main content

Ctrl+K

Site Navigation

新手入门
用户指南
开发者指南
论坛
官网

GitHub
Bilibili

Site Navigation

新手入门
用户指南
开发者指南
论坛
官网

GitHub
Bilibili

Section Navigation

如何安装 MegEngine
用户迁移指南
- MegEngine for NumPy users
- MegEngine for PyTorch users
常见问题汇总
- 显存使用常见问题
- 模型复现常见问题

模型开发（基础篇）

深入理解 Tensor 数据结构
使用 Functional 操作与计算
使用 Data 构建输入 Pipeline
使用 Module 定义模型结构
- Module 基类概念与接口介绍
Autodiff 基本原理与使用
- Autodiff 高阶使用
使用 Optimizer 优化参数
- 参数优化进阶配置
保存与加载模型（S&L）
使用 Hub 发布和加载预训练模型

模型开发（进阶篇）

通过重计算节省显存（Recomputation）
- 使用 DTR 进行显存优化
- 使用 Sublinear 进行显存优化
分布式训练（Distributed Training）
量化（Quantization）
- 量化方案原理讲解
自动混合精度（AMP）
- 使用 NHWC 格式进一步提速
模型性能数据生成与分析（Profiler）
使用 TracedModule 发版
即时编译（JIT）

推理部署篇

模型部署总览与流程建议
使用 MegEngine Lite 部署模型
MegEngine Lite 使用接口
- MegEngine Lite C++ 接口介绍
- MegEngine Lite python 接口介绍
使用 MegEngine Lite 部署模型进阶
使用 Load and run 测试与验证模型

工具与插件篇

参数和计算量统计与可视化
MegEngine 模型可视化
RuntimeOpr 使用说明
自定义算子（Custom Op）

用户指南
使用...

使用 MegEngine Lite 部署模型#

简介#

MegEngine Lite 是 MegEngine 的一层接口封装，主要目的是为用户提供更加简洁、易用、高效的推理接口，充分发挥 MegEngine 的多平台的推理能力，其结构如下:

../../../_images/lite.png

MegEngine Lite 主要是对训推一体的 MegEngine 框架进行一层很薄的封装，并对用户提供多种模型推理接口，包括： C++ / C / Python 接口，同时 MegEngine Lite 底层也可以接入其它的推理框架，以及其他的 NPU 支持。相比较直接调用 MegEngine 的接口进行推理，使用 MegEngine Lite 的接口有使用方便、接口简单、功能齐全等优点，其底层实现依然是 MegEngine, 因此继承了 MegEngine 的所有优点，MegEngine 在推理层面具有以下特点：

高性能#

MegEngine 首先在计算图中对 Inference 做了很多高效的优化，例如：将 BN 融合到 Convolution 中，将 Activation 融合到 Convolution 中等… 这些优化能有效地减少访存，提高计算访存比。另外 MegEngine 还对底层的 Kernel 做了细粒度的优化，从算法到指令都进行深入优化，卷积算法层面 Convolution 就有直接卷积，Im2col, Winograd 等优化，在 Kernel 层面有粗粒度的 Intrinsic 级别的优化，在一些关键的算子会进行汇编，深入指令集优化。

多平台支持#

MegEngine 支持多种主流深度学习推理平台，包括 Arm，X86，Cuda，Rocm，Atlas，Cambricom 等平台，另外 MegEngine Lite 还支持以 RuntimeOpr/Loader 的形式接入第三方推理框架以及NPU。

高精度#

使用 MegEngine 训练的模型可以不需要进行任何模型转换，就可以直接进行推理，有效地避免由于模型转换以及量化等带来的模型精度的损失，降低了模型部署的难度。

接下来：快速上手#

获得用于 MegEngine Lite 推理的模型
MegEngine Lite C++ 模型部署快速上手
MegEngine Lite Python 部署模型快速上手

上一页

模型部署总览与流程建议

下一页

获得用于 MegEngine Lite 推理的模型

On this page

简介
接下来：快速上手

显示源代码