hbDNNQuantiScale

typedef struct {
  int32_t scaleLen;
  float *scaleData;
  int32_t zeroPointLen;
  int32_t *zeroPointData;
} hbDNNQuantiScale;

量化/反量化的缩放数据。

对于输入 ：若采集到浮点数据 data，对应的缩放数据是 scale，零点偏移数据是 zeroPoint，则送入模型的推理数据为 $g((data / scale) + zeroPoint)$ ，其中： $g(x) = clip(round(x))$ ，clip为截断函数，例如U8： $g(x)∈[0, 255]$ ，S8： $g(x)∈[-128, 127]$ 。

对于输出 ：若推理结果 data，对应的缩放数据是 scale，零点偏移数据是 zeroPoint，则最终的推理结果为 $(data - zeroPoint) * scale$ 。

其中 scaleLen 由数据 data 按照 per-axis 或 per-tensor（反）量化方式决定。当数据 data 按 per-tensor （反）量化时，scaleLen 等于 1，此时不需要关注 quantizeAxis 数值；否则 quantizeAxis 表示数据量化轴所在维度索引， scaleLen 等于数据 data 第 quantizeAxis 维度大小。 zeroPointLen 与 scaleLen 保持一致。

成员

成员名称	描述
`scaleLen`	缩放数据的长度。
`scaleData`	缩放数据的首地址。
`zeropointLen`	零点偏移数据的长度。
`zeropointData`	零点偏移数据的首地址。

PTQ转换工具

hb_compile工具

PTQ转换步骤

PTQ转换示例

常见问题及故障处理

附录

开发指南

深入探索

API参考

QAT

模型导出

Horizon算子

常见问题及常见故障

模型推理开发

模型推理API手册

数据结构

功能接口

模型推理工具介绍

hrt_model_exec工具介绍

hbm_infer工具介绍

UCP通用API介绍

数据结构

功能接口

UCP性能分析工具

常见问题及错误码

模型部署原理及流程

模型部署实践指导实例

HMCT API Reference

工具链算子支持约束列表

算子支持列表

算子BPU约束列表

社区优质文章

hbDNNQuantiScale

hb_compile工具

QAT

模型导出

Horizon算子

模型推理API手册

数据结构

功能接口

模型推理工具介绍

hrt_model_exec工具介绍

hbm_infer工具介绍

数据结构

功能接口

算子支持列表

算子BPU约束列表

#hbDNNQuantiScale

hbDNNQuantiScale