使用 Load and run 测试与验证模型#

Load and run 简介

Load and run (简称 LAR ) 是 MegEngine 提供与之相关的配套的推理工具,主要提供了以下功能:

  • 测试各类模型的推理性能,获取模型推理结果以及推理相关信息;

  • 测试验证不同模型优化方法的效果。

本工具提供了大量的配置选项(可以执行 ./load_and_run --help 查看详细的帮助文档), 这些选项可以灵活的适配各种推理所需的场景,能够在不同设备上运行 MegEngine 模型, 给出推理结果以及相应的性能分析结果,是基于 MegEngine 的模型研究和单模型的推理部署的很重要的生产工具。

模型以及相关支持

Load and run 支持 MegEngine 以及 Megengine Lite 提供的相关模型格式的推理,各种模型的获取可以参考 Get a model for MegEngine Lite inference默认使用 MegEngine 的原生接口进行模型推理。

New in version 1.7: 提供了对 Lite 接口的支持,使用时加上 --lite 选项即可切换为 Lite 接口进行推理。

Note

  • 目前发布的版本我们开放了对 CPU(x86, x64, ARM, ARMv8.2)和 GPU(CUDA)平台的支持。

  • 为了方便使用,MegEngine 中还提供了 Load and run Python 接口

有关 Load and run 工具的各种使用细节主要包括以下几个部分:

在使用 Load and run 之前,我们还需要了解如何获取和编译它。

Load and run 获取与编译#

See also

Load and run 源码位于 lite/load-and-run 目录内, 可以使用 MegEngine 提供的 脚本 以及通用的 CMake 方法进行编译,(推荐使用 MegEngine 脚本,更加方便)。

Changed in version 1.7: 源码从 sdk/load-and-run 目录迁移到 lite/load_and_run 目录内。

cd <megengine_dir>
scripts/cmake-build/host_build.sh -e load_and_run
scripts/cmake-build/cross_build_android_arm_inference.sh -e load_and_run -a <arm_arch>

Note

这一脚本会自动创建一个 build_dir 目录,里面将根据不同的编译选项创建不同命名的文件夹, 最终都会有 buildinstall 两个文件夹。 其中 Load and run 在 build/lite/load_and_run 以及 install/bin 下面各有一份 —— 相比于 build 目录下的文件, install 版本会移除( strip )掉一些用于调试的信息, 因此调试时建议使用 build 目录下的文件。

常用编译参数说明#

不同设备和不同应用场景下上述编译方法所需要的参数差异比较大,CMake 方法可以更加灵活的控制各种编译参数, 但代价是学习使用成本很高,需要对 MegEngine 很熟悉。 所以在此不做过多介绍,感兴趣的读者可以参考脚本编译方法中的脚本内容学习研究。 下面就与 Load and run 相关的脚本参数进行说明。

脚本 scripts/cmake-build/host_build.sh 适用于编译在本地主机上运行的程序,常见用法如下:

scripts/cmake-build/host_build.sh -e load_and_run

设置编译目标为 Load and run(下方示范用法同理),使用默认参数

scripts/cmake-build/host_build.sh -d -e load_and_run

开启 Debug 选项

scripts/cmake-build/host_build.sh -c -e load_and_run

开启 CUDA 支持

scripts/cmake-build/host_build.sh -r -e load_and_run

编译前移除之前的 build 文件

EXTRA_CMAKE_ARGS=“-DMGB_ENABLE_JSON=1” scripts/cmake-build/host_build.sh -e load_and_run

编译时导入其他 CMake 设置参数

更多参数选项说明

  • 在 Linux 和 MacOS 中该脚本构建的程序位数和系统位数相当; 在 Windows 下默认构建 64bit 程序, 可以通过设置 -m 选项编译 32bit 程序(仅在 Windows 下适用);

  • CMake 用到的各个 options 可以通过设置 -l 来查看;

  • 其他默认参数可以通过设置 -h 选项获取,各个参数可以组合使用,从而达到不同的编译目标, 其他平台编译以及更多的使用方法可以参考 BUILD_README

Warning

  • 默认情况下脚本会构建所有的目标,同时会把所有目标和头文件安装到前述的 install 目录下;

  • 当使用 -e 编译单个目标时,只会构建指定的目标,不会进行 install 操作。

仅仅当需要类似发版本的动作时,才建议加上 -r 参数

当加入 -r 参数后,项目将会完整地重新开始编译,这种情况耗时会比较多。 当仅仅修改或新增了一些 .cpp/.h 文件时, 可以不加此参数来进行增量构建; 当修改或删除一些 .cpp/.h 或者修改了 CMakeLists.txt 文件时, 由于 CMake 本身存在一些缺陷,这个时候需要先删除 CMake 的缓存:

find build_dir/ -name CMakeCache.txt | xargs rm -rf

此时同样可以通过不加 -r 来完成增量构建。