morpheus.stages.inference.triton_inference_stage.TritonInferenceWorker

NVIDIA Docs Hub NVIDIA Morpheus NVIDIA Morpheus (24.06) morpheus.stages.inference.triton_inference_stage.TritonInferenceWorker

(Latest Version)

class TritonInferenceWorker(inf_queue, c, model_name, server_url, force_convert_inputs, input_mapping=None, output_mapping=None, use_shared_memory=False, needs_logits=False)[source]

Bases: morpheus.stages.inference.inference_stage.InferenceWorker

Inference worker class for all Triton inference server requests.

Parameters

inf_queue : morpheus.utils.producer_consumer_queue.ProducerConsumerQueue
c : morpheus.config.Config
model_name
server_url
force_convert_inputs: bool
inout_mapping
use_shared_memory: bool, default = False
needs_logits

Attributes

needs_logits

Methods

`build_output_message`(x)	Create initial inference response message with result values initialized to zero.
`calc_output_dims`(x)	Calculates the dimensions of the inference output message data given an input message.
`init`()	This function instantiate triton client and memory allocation for inference input and output.
`process`(batch, callback)	This function sends batch of events as a requests to Triton inference server using triton client API.
`stop`()	Override this function to stop the inference workers or carry out any additional cleanups.

supports_cpp_node

build_output_message(x)[source]

Create initial inference response message with result values initialized to zero. Results will be set in message as each inference mini-batch is processed.

Parameters

x : morpheus.pipeline.messages.MultiInferenceMessage

Returns

morpheus.pipeline.messages.MultiResponseMessage

calc_output_dims(x)[source]

Calculates the dimensions of the inference output message data given an input message.

Parameters

x : morpheus.pipeline.messages.MultiInferenceMessage

Returns

typing.Tuple

init()[source]

process(batch, callback)[source]

This function sends batch of events as a requests to Triton inference server using triton client API.

Parameters

batch : morpheus.pipeline.messages.MultiInferenceMessage
callback : morpheus.pipeline.messages.TensorMemory

stop()[source]

Previous morpheus.stages.inference.triton_inference_stage.TritonInferenceStage

Next morpheus.stages.input