Logo
Trascina e ridimensiona in Modifica
Panoramica live Schede
Confronto

Confronto

Tassa gateway = (gateway - diretto).
Auto-pick: Direct + GW Mini trend · last samples
Come misuriamo

Metodologia

Ogni valore di latenza deriva da prompt chat completi inviati al provider; attendiamo le risposte in streaming, includendo overhead del provider, tempo di ragionamento del modello e trasporto.

  • I campioni aggregano flussi di conversazione reali, non ping.
  • Tassa gateway = latenza gateway - latenza diretta.
  • I badge di freschezza combinano numero di campioni e timestamp dell'ultima esecuzione.
Rankings

Avg heute (UTC)

Top 10 · min 3 samples
#2 Groq Direct openai/gpt-oss-120b
n=33
120 ms
#3 Groq Direct openai/gpt-oss-20b
n=50
121 ms
#4 Groq Direct llama-3.1-8b-instant
n=33
177 ms
#5 Mistral Direct open-mistral-7b
n=33
181 ms
#6 Mistral Direct voxtral-mini-latest
n=33
184 ms
n=33
185 ms
#8 Mistral Direct voxtral-small-latest
n=49
186 ms
#9 Groq Direct groq/compound
n=33
194 ms
#10 Mistral Direct voxtral-small-2507
n=49
196 ms

Schnellste Messung (letzte 20m)

Top 10 · min 1 sample
#1 Groq Direct openai/gpt-oss-20b
n=10
64 ms
#3 Groq Direct openai/gpt-oss-120b
n=7
109 ms
#4 Groq Direct groq/compound
n=7
118 ms
#5 Groq Direct llama-3.1-8b-instant
n=7
132 ms
#6 Mistral Direct voxtral-mini-latest
n=7
132 ms
#7 Mistral Direct voxtral-small-latest
n=10
134 ms
#8 Mistral Direct pixtral-12b-latest
n=7
135 ms
#9 Groq Direct qwen/qwen3-32b
n=7
144 ms
#10 Mistral Direct open-mistral-7b
n=7
144 ms
Andamento latenza
Andamento latenza

Legend

Mappa server API

Mappa server API

Live endpoints
Top regions
Data lädt …
I marker mostrano gli IP endpoint API osservati (GeoIP in cache).
Misuriamo dalla Germania; il nostro server è indicato sulla mappa.