浮点数量化相关 Module
的基类。主要用于 QAT 和 Calibration.
使用 from_float_module
从浮点数型 Module
中生成实例。或使用 quantize_qat
来自动递归进行此操作。
可之后使用 quantize
将该模块转为 QuantizedModule
用于部署。
-
apply_quant_activation(target)[源代码]
在 target
上根据 qconfig
应用权重 observer 以及 fake_quant.
-
apply_quant_bias(target, inp, w_qat)[源代码]
使用 fake_quant_bias
来处理 target
. 只有当 act_fake_quant
和 weight_fake_quant
都启动时合法。
-
apply_quant_weight(target)[源代码]
在 target
上根据 qconfig
应用权重 observer 以及 fake_quant.
-
abstract classmethod from_float_module(float_module)[源代码]
返回从浮点型 Module
实例转换而来的 QATModule
实例。
-
get_activation_dtype()[源代码]
按照 qconfig 指定的方法,从 qconfig
中获取激活值的量化数据类型。
-
get_activation_qparams()[源代码]
获取激活值的量化参数。
-
get_weight_dtype()[源代码]
从 qconfig
中获取权重的量化数据类型。
-
get_weight_qparams()[源代码]
获取权重的量化参数。
-
set_qconfig(qconfig)[源代码]
使用 qconfig
更改量化相关配置。包含权重和激活值的 observer 和 fake_quant 。