模型开发接口
推理部署接口
API 相关说明
一个通过记录输入 Tensor 的滑动最小值、最大值来计算 scale 的 Observer。
mode (QuantMode) – 量化模式
QuantMode
eps (float) – 最大值的初始值,防止除 0 错误的发生。
float
dtype (Union[str, QuantDtypeMeta]) – 字符串,表明按何种dtype来收集scale和zero_point。
Union
str
QuantDtypeMeta
上一页
Observer
下一页
SyncMinMaxObserver