模型开发接口
推理部署接口
API 相关说明
根据输入张量和权值张量的特殊的数值范围,对偏置张量进行假量化,并把量化类型设置为qint32。
bias (Tensor) – 需要被假量化的偏置张量。
Tensor
inp (Tensor) – 包含了量化参数的输入张量。
w_qat (Tensor) – 包含了量化参数的权值张量。
警告
现在只对对称的量化方法有效。
上一页
megengine.quantization.create_qparams
下一页
megengine.quantization.fake_quant_tensor