浮点模型准备

S100工具链支持您通过PTQ(训练后量化)或者QAT(量化感知训练)的方式对模型进行量化,两条链路对浮点模型的输入要求不同,如下所示:

  • PTQ链路:支持包括Caffe、Pytorch、TensorFlow、PaddlePaddle等常见DL框架,其中Caffe框架直接支持,其他框架需转为ONNX模型进行支持,ONNX模型需满足opset10-19的版本要求。PTQ链路的详细介绍可参考 训练后量化(PTQ) 章节。
注意
  • 对于Caffe模型,您需先完成模型浮点精度的评测以确保模型的权重及结构正确。

  • 对于ONNX模型,您需先使用HBRuntime进行推理,验证ONNX模型和原DL框架模型推理结果一致(即验证模型合法性)。

  • QAT链路:我们提供了插件,能够直接对Pytorch导出的torch module进行转换编译支持,对于导出的torch module您可先完成模型浮点精度的评测以确保模型的权重及结构正确。QAT链路的详细介绍可参考 量化感知训练(QAT) 章节。