Vergleich
Gateway-Abgabe = (Gateway - Direkt).
Auto-pick: Direct + GW
Mini trend · last samples
Methodik
Jeder Latenzwert stammt aus vollständigen Chat-Prompts, die zum Provider gesendet werden; wir warten auf gestreamte Antworten und erfassen Provider-Overhead, Denkzeit des Modells und Transport.
- Samples fassen echte Gesprächsverläufe zusammen, keine Pings.
- Gateway-Abgabe = Gateway-Latenz - Direkt-Latenz.
- Freshness-Badges kombinieren Sample-Anzahl und Zeitstempel des letzten Laufs.
Avg heute (UTC)
Top 10 · min 3 samples
#1
Groq Direct
n=33
101 ms
#2
Groq Direct
n=33
120 ms
#3
Groq Direct
n=50
121 ms
#4
Groq Direct
n=33
177 ms
#5
Mistral Direct
n=33
181 ms
#6
Mistral Direct
n=33
184 ms
#7
Groq Direct
n=33
185 ms
#8
Mistral Direct
n=49
186 ms
#9
Groq Direct
n=33
194 ms
#10
Mistral Direct
n=49
196 ms
Schnellste Messung (letzte 20m)
Top 10 · min 1 sample
#1
Groq Direct
n=10
64 ms
#2
Groq Direct
n=7
71 ms
#3
Groq Direct
n=7
109 ms
#4
Groq Direct
n=7
118 ms
#5
Groq Direct
n=7
132 ms
#6
Mistral Direct
n=7
132 ms
#7
Mistral Direct
n=10
134 ms
#8
Mistral Direct
n=7
135 ms
#9
Mistral Direct
n=7
144 ms
#10
Groq Direct
n=7
144 ms
Latenzverlauf
Legend
API-Server-Karte
Live endpoints
Top regions
Data lädt …
Wir messen aus Deutschland; unser Server ist auf der Karte markiert.