API 相关说明
一个通过记录输入 Tensor 的滑动最小值、最大值来计算 scale 的 Observer。
mode (QuantMode) – set quantization mode.
QuantMode
eps (float) – a initial maximum value to avoid division by zero problem.
float
dtype (Union[str, QuantDtypeMeta]) – 字符串,表明按何种dtype来收集scale和zero_point。
Union
str
QuantDtypeMeta
上一页
Observer
下一页
SyncMinMaxObserver