hmct.api.ORTExecutor

接口说明

HMCT提供的模型推理功能，用于支持对模型转换过程中产生的中间模型进行推理。

接口形式

class ORTExecutor(ORTExecutorBase):
    def __init__(self, model:ModelProto):

    def create_session(self): -> InferenceSession

    def get_support_devices(cls) -> list[str]
    
    def to(self, device:Union[str, list[str]]) -> None
    
    def get_inputs(self) -> list[str]
    
    def get_outputs(self) -> list[str]
    
    def inference(self, inputs：Dict[str, np.ndarray])->Dict[str, np.ndarray]

成员函数

成员函数	详细说明	返回值	合法参数值取值范围
ORTExecutor.init(self, model: ModelProto)	类初始化函数，传入一个onnx ModelProto对象	无	一个onnx ModelProto对象
def create_session(self): -> InferenceSession	创建用于推理的session	用于推理的InferenceSession	无参数
def get_support_devices(cls) -> list[str]	获取当前ORTExecutor所有支持的device	当前支持的device的string list	无参数
def to(self, device:Union[str, list[str]]) -> None	修改模型推理是运行device	无	'cuda', 'cpu'或者二者组成的list
def get_inputs(self) -> list[str]	获取一个由模型输入的NodeArg类组成的list，NodeArg类有三个成员变量，name表示输入的名字，type表示输入的数据类型，shape表示输入的大小 `class NodeArg: def __init__(self, name: str, type: int, shape: Sequence[Union[int, str]]): self.name = name self.type = type self.shape = shape`	由模型输入的NodeArg类组成的list	无参数
def get_outputs(self) -> list[str]	获取一个由模型输出的NodeArg类组成的list，NodeArg类有三个成员变量，name表示输出的名字，type表示输出的数据类型，shape表示输出的大小，NodeArg定义同get_inputs中的描述	由模型输出的NodeArg类组成的list	无参数
def inference(self, inputs：Dict[str, np.ndarray])->Dict[str, np.ndarray]	使用输入数据进行一次前向推理，获得推理结果并返回	一个Dict，key是模型输出name str，value是输出结果np.ndarray	一个dict，key为输入name的字符串，value为这次推理的输入 `{ 'input_name0': np.ndarray, 'input_name1': np.ndarray, ... }`

页面目录

PTQ转换工具

hb_compile工具

PTQ转换步骤

PTQ转换示例

常见问题及故障处理

附录

开发指南

深入探索

API参考

QAT

模型导出

Horizon算子

常见问题及常见故障

模型推理开发

模型推理API手册

数据结构

功能接口

模型推理工具介绍

hrt_model_exec工具介绍

hbm_infer工具介绍

UCP通用API介绍

数据结构

功能接口

UCP性能分析工具

常见问题及错误码

模型部署原理及流程

模型部署实践指导实例

HMCT API Reference

工具链算子支持约束列表

算子支持列表

算子BPU约束列表

社区优质文章

hmct.api.ORTExecutor

接口说明

接口形式

成员函数

hb_compile工具

QAT

模型导出

Horizon算子

模型推理API手册

数据结构

功能接口

模型推理工具介绍

hrt_model_exec工具介绍

hbm_infer工具介绍

数据结构

功能接口

算子支持列表

算子BPU约束列表

#hmct.api.ORTExecutor

#接口说明

#接口形式

#成员函数

hmct.api.ORTExecutor

接口说明

接口形式

成员函数