NVIDIA Docs Hub NVIDIA Morpheus NVIDIA Morpheus (25.02.01) morpheus.stages.inference.triton_inference_stage.TritonInferenceNLP

morpheus.stages.inference.triton_inference_stage.TritonInferenceNLP

class TritonInferenceNLP(inf_queue, c, model_name, server_url, force_convert_inputs=False, use_shared_memory=False, inout_mapping=None)[source]

Bases: morpheus.stages.inference.triton_inference_stage._TritonInferenceWorker

This class extends TritonInference to deal with scenario-specific NLP models inference requests like building response.

Parameters

inf_queuemorpheus.utils.producer_consumer_queue.ProducerConsumerQueue
cmorpheus.config.Config
model_namestr
server_urlstr
force_convert_inputsbool, default = False
use_shared_memorybool, default = False
inout_mappingtyping.Dict[str, str]

Methods

`build_output_message`(x)	Create initial inference response message with result values initialized to zero.
`calc_output_dims`(x)	Calculates the dimensions of the inference output message data given an input message.
`default_inout_mapping`()	Returns default dictionary used to map NLP pipeline input/output names to Triton input/output names
`init`()	This function instantiate triton client and memory allocation for inference input and output.
`needs_logits`()	Determines whether a logits calculation is needed for the value returned by the Triton inference response.
`process`(batch, cb)	This function sends batch of events as a requests to Triton inference server using triton client API.
`stop`()	Override this function to stop the inference workers or carry out any additional cleanups.

supports_cpp_node

build_output_message(x)[source]

Create initial inference response message with result values initialized to zero. Results will be set in message as each inference mini-batch is processed.

Parameters

xmorpheus.pipeline.messages.MultiInferenceMessage

Returns

morpheus.pipeline.messages.MultiResponseMessage

calc_output_dims(x)[source]

Calculates the dimensions of the inference output message data given an input message.

Parameters

xmorpheus.pipeline.messages.MultiInferenceMessage

Returns

typing.Tuple

classmethod default_inout_mapping()[source]

Returns default dictionary used to map NLP pipeline input/output names to Triton input/output names

Returns

default_inout_mappingtyping.Dict[str, str]

init()[source]

classmethod needs_logits()[source]

process(batch, cb)[source]

This function sends batch of events as a requests to Triton inference server using triton client API.

Parameters

batchmorpheus.pipeline.messages.MultiInferenceMessage
cbtyping.Callable[[morpheus.pipeline.messages.TensorMemory], None]

stop()[source]

Previous morpheus.stages.inference.triton_inference_stage.TritonInferenceFIL

Next morpheus.stages.inference.triton_inference_stage.TritonInferenceStage