Question 1

Qu'est-ce qu'un AI Gateway ?

Accepted Answer

Un AI Gateway est un reverse-proxy intelligent placé entre votre application et les APIs LLM (OpenAI, Anthropic, Mistral, Google…). Il centralise le routing, le failover, le caching, le rate limiting et l'observabilité. Plutôt que d'intégrer chaque SDK provider séparément, vous n'en gérez qu'un seul point d'entrée.

Question 2

Latenza est-il vraiment compatible avec l'API OpenAI ?

Accepted Answer

Oui, à 100%. Latenza implémente la même interface que l'API OpenAI (chat/completions, embeddings, models). Vous changez uniquement base_url et api_key dans votre client OpenAI existant. Aucune migration de code, aucun nouveau SDK à apprendre.

Question 3

Quels providers LLM sont supportés ?

Accepted Answer

OpenAI (GPT-4o, GPT-4o mini…), Anthropic (Claude 3.5 Sonnet, Haiku…), Mistral (Large, Small, Nemo…) et Google (Gemini 2.0 Flash, Gemini 1.5 Pro…). La liste s'enrichit régulièrement — consultez la documentation pour le catalogue complet.

Question 4

Comment fonctionne le routing multi-critères ?

Accepted Answer

Vous définissez des règles via l'interface ou l'API : priorité par coût, par latence, par capacité de contexte ou par modèle préféré. Latenza évalue chaque requête en temps réel et sélectionne le provider optimal. En cas d'indisponibilité, il bascule automatiquement sur le provider suivant dans la liste.

Question 5

Quelle est la différence entre Latenza, LiteLLM et Portkey ?

Accepted Answer

LiteLLM est une librairie open source que vous auto-hébergez et maintenez vous-même. Portkey est un SaaS comparable à Latenza mais orienté enterprise avec des engagements contractuels longs. Latenza vise les équipes produit qui veulent la puissance d'un gateway complet sans la complexité opérationnelle — démarrage en 5 minutes, pricing transparent.

Question 6

Mes données de prompts transitent-elles par vos serveurs ?

Accepted Answer

Oui : en tant que gateway, Latenza proxie les requêtes vers les providers. Le contenu des requêtes transite par notre infrastructure en Europe mais n'est pas conservé au-delà des logs d'observabilité (configurable). Les logs peuvent être désactivés en Enterprise. Nous ne ré-utilisons jamais vos données pour entraîner des modèles.

Question 7

Comment est calculée la facturation ?

Accepted Answer

Vous achetez des crédits Latenza. Chaque appel LLM est débité au coût réel du provider (prix public), auquel s'ajoute la marge platform Latenza. Le détail du coût par appel, par modèle et par assistant est disponible dans votre dashboard. Les crédits non consommés sont reportés de mois en mois.

Fonctionnalité	Latenza	LiteLLM	Portkey	OpenRouter
Routing multi-critères				~
Failover automatique				~
Caching sémantique			~	—
Rate limiting				—
Observabilité native		~		~
Multi-tenant		~		—
API OpenAI compatible
SaaS clé en main		—
Open source	—		—	—

L'AI Gateway
multi‑provider
pour vos équipes.

Gérer plusieurs LLMs en prod
sans gateway, c'est risqué.

Trop de providers, trop de SDKs

Coûts LLM invisibles jusqu'à la facture

Un provider qui tombe, une feature qui casse

Tout ce qu'il faut pour vos LLMs
en production.

Chaque requête va au bon modèle, automatiquement

Voyez exactement ce que vos LLMs coûtent

Failover automatique

Caching sémantique

Rate limiting

Compatible OpenAI

De zéro à prod
en 4 étapes.

Créez votre clé API Latenza

Pointez votre client OpenAI

Configurez vos routes

Observez et optimisez

Ce que disent
nos premiers utilisateurs.

Adapté à votre profil.

Contrôlez vos coûts LLM dès le premier appel

Routing avancé et observabilité pour plusieurs squads

Multi-tenant et facturation client sans infrastructure

Latenza vs les alternatives.

Questions fréquentes.

Une API, tous vos modèles.

L'AI Gatewaymulti‑providerpour vos équipes.

Gérer plusieurs LLMs en prodsans gateway, c'est risqué.