Glossaire AI-Native
Définitions, contextes et exemples concrets des termes que nous utilisons chaque semaine sur les engagements AI-native. Patron : définition → quand ça compte → exemple réel → KPI.
Delivery & opérations
AI-native
Un modèle de delivery où l'IA est la couche opérationnelle du workflow, pas une fonctionnalité ajoutée par-dessus.
Workflow IA
Un processus opérationnel borné où l'IA gère des étapes définies end-to-end avec des KPIs mesurables.
Thin slice
Un déploiement production étroit et end-to-end qui prouve un workflow IA sur données réelles et cas limites.
Discovery sprint
Un engagement payé de 2 semaines qui cartographie le workflow, les métriques baseline, les systèmes et le modèle de risque.
Architecture
IA agentique
Systèmes IA capables de planifier, exécuter des actions multi-étapes et utiliser des outils pour compléter des tâches en autonomie.
Agent autonome
Un agent IA qui complète une tâche définie sans intervention humaine à chaque étape.
RAG (Retrieval-Augmented Generation)
Génération ancrée dans des sources documentaires récupérées plutôt que dans la mémoire paramétrique seule du modèle.
Architecture Multi-LLM
Router différentes tâches vers différents modèles selon les tradeoffs coût, qualité, latence et capacité.
Embeddings
Représentations vectorielles denses de texte (ou autres données) qui capturent le sens sémantique pour la recherche par similarité.
Vector store
Base de données spécialisée pour stocker et chercher des embeddings vectoriels à grande échelle.
Recherche sémantique
Recherche basée sur le sens plutôt que le matching de mots-clés exacts.
Recherche hybride
Combinaison de recherche sémantique (embeddings) et keyword (BCM25) pour de meilleurs résultats que chaque méthode seule.
Tool use
Capacité d'un LLM à invoquer des capabilities déterministes — APIs, bases de données, exécution de code — dans sa réponse.
Function calling
Implémentation spécifique du tool use où le modèle émet des appels JSON structurés vers des fonctions enregistrées.
MCP (Model Context Protocol)
Protocole standard d'Anthropic pour connecter les clients AI à des serveurs d'outils et de données externes.
Sortie structurée
Modèles retournant du JSON conforme à un schéma plutôt que du texte libre, validés au moment de l'inference.
ReAct
Pattern d'agent IA qui alterne reasoning (« Thought ») et actions (« Action ») pour les tâches multi-étapes.
Chain of thought (CoT)
Technique de prompting qui pousse le modèle à montrer les étapes de raisonnement avant de produire la réponse finale.
Évaluation & qualité
Versioning de prompts
Traiter les prompts comme du code : stockés, diffés, reviewés et rollbackés comme n'importe quel artefact production.
Harnais d'évaluation
Test framework automatisé qui score les sorties IA contre un test set labellisé avant promotion en production.
Test set labellisé
Une collection d'inputs avec sorties attendues, utilisée pour évaluer les versions de prompts avant promotion.
Score de confiance
Un scalaire qui estime à quel point la sortie d'un modèle est fiable pour une entrée donnée.
Gouvernance & risque
Grounding
Ancrer la sortie d'un modèle dans un matériel source vérifiable pour réduire les hallucinations.
Hallucination
Quand un LLM génère du contenu plausible mais factuellement faux, fabriqué, ou non supporté par ses sources.
Guardrails
Validateurs déterministes qui encapsulent un modèle pour bloquer les entrées malveillantes et imposer la conformité de sortie.
Prompt injection
Attaque où l'input malveillant manipule le LLM pour ignorer ses instructions ou exécuter des actions non voulues.
Gouvernance IA
Politiques, processus et contrôles qui rendent un système IA auditable et accountable.
NIST AI RMF
Framework volontaire du NIST américain pour gérer les risques des systèmes IA sur tout leur cycle de vie.
Model card
Documentation décrivant l'usage prévu, les limitations, l'évaluation et les risques d'un modèle.
Audit log
Enregistrement immuable de chaque inference call, action et décision reviewer dans un système IA.
File de reviewer
Workflow où les sorties IA à faible confiance ou à fort impact sont routées vers un humain pour approbation.
Modèles & fondations
Fenêtre de contexte
Quantité maximale de tokens (input + output) qu'un LLM peut traiter en un seul call.
Modèle frontier
Le modèle de plus haute capacité disponible chez un fournisseur, optimisé pour le reasoning à fort enjeu.
Foundation model
Grand modèle pré-entraîné qui sert de base à toutes les applications IA dans une famille de modèles.
LLM (Large Language Model)
Un grand modèle de langage entraîné sur des corpus textuels massifs, capable de générer et raisonner sur du texte.
Transformer
L'architecture de réseau de neurones qui sous-tend les LLMs modernes, basée sur l'attention auto-référentielle.
Multimodal
Modèles qui peuvent traiter et générer plusieurs types de média : texte, image, audio, vidéo.
Fine-tuning
Adapter un foundation model pré-entraîné sur des données spécifiques à une tâche pour améliorer la performance sur une tâche étroite.
LoRA (Low-Rank Adaptation)
Méthode de fine-tuning parameter-efficient qui entraîne de petits adapters au lieu du modèle complet.
Extended thinking
Un mode modèle qui exécute un reasoning interne plus long avant de produire la réponse.