引言

在这部分,您将了解 MegEngine 的一些高级用法。

为了学习这部分内容,您需要掌握 基础学习 内容。

这部分共包含八个小节,彼此相对独立,您可以根据个人兴趣和需求进行选择性阅读。

  1. 分布式训练 :介绍如何进行分布式训练模型。

  2. 更细粒度的参数优化设置 :介绍更加细粒度的参数优化设置方法。

  3. Trace 与 Dump :介绍如何将动态图 trace 成静态图,并序列化到文件中。

  4. 亚线性内存优化 :介绍 MegEngine 的亚线性内存优化技术。

  5. 模型部署 :介绍如何将 MegEngine 模型在 C++ 环境下运行。

  6. 量化 :介绍如何在 MegEngine 中使用训练中量化(QAT)以及后量化。

  7. 如何使用 load_and_run :介绍如何使用 load_and_run 对模型推理测速。

  8. NVIDIA GPU测试量化模型性能 : 介绍如何使用 load_and_run 在 nvidia GPU 上测速。

  9. 如何使用 MegEngine 的 codegen :介绍如何使用 codegen。

  10. 如何使用 load_and_run :介绍如何使用load_and_run对模型推理测速。

  11. NVIDIA GPU测试量化模型性能: 介绍如何使用load_and_run在nvidia GPU上测速。

  12. 如何在端上裁剪MegEngine库: 介绍如何在端上使用midout裁剪基于MegEngine的应用程序。