Terme défini
Guardrails
Validateurs déterministes qui encapsulent un modèle pour bloquer les entrées malveillantes et imposer la conformité de sortie.
Les guardrails enveloppent le modèle avec des validateurs déterministes : input filters (bloquent prompt injection, fuites PII), output filters (bloquent contenu sensible, imposent JSON schema, vérifient citation), et policy enforcers (refusent les requêtes hors-scope). Des guardrails production-grade incluent du logging et une soupape vers la review humaine.
Termes liés
Prompt injection
Attaque où l'input malveillant manipule le LLM pour ignorer ses instructions ou exécuter des actions non voulues.
Gouvernance IA
Politiques, processus et contrôles qui rendent un système IA auditable et accountable.
Grounding
Ancrer la sortie d'un modèle dans un matériel source vérifiable pour réduire les hallucinations.
Hallucination
Quand un LLM génère du contenu plausible mais factuellement faux, fabriqué, ou non supporté par ses sources.
On utilise ça chaque semaine
Réserver un appel de 30 min
Réservez un appel de 30 min et on vous montre comment Guardrails apparaît dans un engagement réel qu'on opère.
Réserver un appel de 30 min