> For clean Markdown of any page, append .md to the page URL.
> For a complete documentation index, see https://docs.nvidia.com/nemo/relay/llms.txt.
> For full documentation content, see https://docs.nvidia.com/nemo/relay/llms-full.txt.
> For AI client integration (Claude Code, Cursor, etc.), connect to the MCP server at https://docs.nvidia.com/nemo/relay/_mcp/server.

# Struct Usage

> Token usage statistics from an LLM API response.

Generated from `cargo doc --no-deps -p nemo-relay -p nemo-relay-adaptive -p nemo-relay-ffi`.

<pre />

Token usage statistics from an LLM API response.

All fields are `Option<u64>` because not every provider supplies every field. For example, cache token counts are only available from providers that support prompt caching.

## Fields

### `prompt_tokens: Option<u64>`

Tokens consumed by the prompt/input.

### `completion_tokens: Option<u64>`

Tokens generated in the completion/output.

### `total_tokens: Option<u64>`

Total tokens (prompt + completion).

### `cache_read_tokens: Option<u64>`

Tokens served from prompt cache (read).

### `cache_write_tokens: Option<u64>`

Tokens written to prompt cache.

## Trait Implementations

### `impl Clone for Usage`

<pre />

#### `clone`

<pre />

#### `clone_from`

<pre />

### `impl Debug for Usage`

<pre />

#### `fmt`

<pre />

### `impl Default for Usage`

<pre />

#### `default`

<pre />

### `impl<'de> Deserialize<'de> for Usage`

<pre />

#### `deserialize`

<pre />

### `impl PartialEq for Usage`

<pre />

#### `eq`

<pre />

#### `ne`

<pre />

### `impl Serialize for Usage`

<pre />

#### `serialize`

<pre />

### `impl Eq for Usage`

<pre />

### `impl StructuralPartialEq for Usage`

<pre />