triton-triton-metrics-api

Triton Metrics API

Prometheus-compatible metrics API for monitoring server and model performance including inference request counts, latencies, GPU utilization, and memory usage.

Documentation GitHub OpenAPI

OpenAPI

#Metrics #Monitoring #Observability #Prometheus

← Back to T APIs

API Learnings

Toolbox

API Evangelist LLC

Triton Metrics API

Documentation

Specifications

Other Resources

OpenAPI

API Details

Provider

Explore more