量化/反量化的缩放数据。
对于输入 :若采集到浮点数据 data
, 对应的缩放数据是 scale
,零点偏移数据是 zeroPoint
,则送入模型的推理数据为,其中: ,clip为截断函数,例如U8: ,S8: 。
对于输出 :若推理结果 data
,对应的缩放数据是 scale
,零点偏移数据是 zeroPoint
,则最终的推理结果为 。
其中 scaleLen
由数据 data
按照 per-axis
或 per-tensor
(反)量化方式决定。 当数据 data
按 per-tensor
(反)量化时,scaleLen
等于 1
,此时不需要关注 quantizeAxis
数值;
否则 quantizeAxis
表示数据量化轴所在维度索引, scaleLen
等于数据 data
第 quantizeAxis
维度大小。 zeroPointLen
与 scaleLen
保持一致。
成员名称 | 描述 |
---|---|
scaleLen | 缩放数据的长度。 |
scaleData | 缩放数据的首地址。 |
zeropointLen | 零点偏移数据的长度。 |
zeropointData | 零点偏移数据的首地址。 |