Glossaire AI-Native

Définitions, contextes et exemples concrets des termes que nous utilisons chaque semaine sur les engagements AI-native. Patron : définition → quand ça compte → exemple réel → KPI.

Delivery & opérations

AI-native

Un modèle de delivery où l'IA est la couche opérationnelle du workflow, pas une fonctionnalité ajoutée par-dessus.

Workflow IA

Un processus opérationnel borné où l'IA gère des étapes définies end-to-end avec des KPIs mesurables.

Thin slice

Un déploiement production étroit et end-to-end qui prouve un workflow IA sur données réelles et cas limites.

Discovery sprint

Un engagement payé de 2 semaines qui cartographie le workflow, les métriques baseline, les systèmes et le modèle de risque.

Architecture

IA agentique

Systèmes IA capables de planifier, exécuter des actions multi-étapes et utiliser des outils pour compléter des tâches en autonomie.

Agent autonome

Un agent IA qui complète une tâche définie sans intervention humaine à chaque étape.

RAG (Retrieval-Augmented Generation)

Génération ancrée dans des sources documentaires récupérées plutôt que dans la mémoire paramétrique seule du modèle.

Architecture Multi-LLM

Router différentes tâches vers différents modèles selon les tradeoffs coût, qualité, latence et capacité.

Embeddings

Représentations vectorielles denses de texte (ou autres données) qui capturent le sens sémantique pour la recherche par similarité.

Vector store

Base de données spécialisée pour stocker et chercher des embeddings vectoriels à grande échelle.

Recherche sémantique

Recherche basée sur le sens plutôt que le matching de mots-clés exacts.

Recherche hybride

Combinaison de recherche sémantique (embeddings) et keyword (BCM25) pour de meilleurs résultats que chaque méthode seule.

Tool use

Capacité d'un LLM à invoquer des capabilities déterministes — APIs, bases de données, exécution de code — dans sa réponse.

Function calling

Implémentation spécifique du tool use où le modèle émet des appels JSON structurés vers des fonctions enregistrées.

MCP (Model Context Protocol)

Protocole standard d'Anthropic pour connecter les clients AI à des serveurs d'outils et de données externes.

Sortie structurée

Modèles retournant du JSON conforme à un schéma plutôt que du texte libre, validés au moment de l'inference.

ReAct

Pattern d'agent IA qui alterne reasoning (« Thought ») et actions (« Action ») pour les tâches multi-étapes.

Chain of thought (CoT)

Technique de prompting qui pousse le modèle à montrer les étapes de raisonnement avant de produire la réponse finale.

Évaluation & qualité

Versioning de prompts

Traiter les prompts comme du code : stockés, diffés, reviewés et rollbackés comme n'importe quel artefact production.

Harnais d'évaluation

Test framework automatisé qui score les sorties IA contre un test set labellisé avant promotion en production.

Test set labellisé

Une collection d'inputs avec sorties attendues, utilisée pour évaluer les versions de prompts avant promotion.

Score de confiance

Un scalaire qui estime à quel point la sortie d'un modèle est fiable pour une entrée donnée.

Gouvernance & risque

Grounding

Ancrer la sortie d'un modèle dans un matériel source vérifiable pour réduire les hallucinations.

Hallucination

Quand un LLM génère du contenu plausible mais factuellement faux, fabriqué, ou non supporté par ses sources.

Guardrails

Validateurs déterministes qui encapsulent un modèle pour bloquer les entrées malveillantes et imposer la conformité de sortie.

Prompt injection

Attaque où l'input malveillant manipule le LLM pour ignorer ses instructions ou exécuter des actions non voulues.

Gouvernance IA

Politiques, processus et contrôles qui rendent un système IA auditable et accountable.

NIST AI RMF

Framework volontaire du NIST américain pour gérer les risques des systèmes IA sur tout leur cycle de vie.

Model card

Documentation décrivant l'usage prévu, les limitations, l'évaluation et les risques d'un modèle.

Audit log

Enregistrement immuable de chaque inference call, action et décision reviewer dans un système IA.

File de reviewer

Workflow où les sorties IA à faible confiance ou à fort impact sont routées vers un humain pour approbation.

Modèles & fondations

Fenêtre de contexte

Quantité maximale de tokens (input + output) qu'un LLM peut traiter en un seul call.

Modèle frontier

Le modèle de plus haute capacité disponible chez un fournisseur, optimisé pour le reasoning à fort enjeu.

Foundation model

Grand modèle pré-entraîné qui sert de base à toutes les applications IA dans une famille de modèles.

LLM (Large Language Model)

Un grand modèle de langage entraîné sur des corpus textuels massifs, capable de générer et raisonner sur du texte.

Transformer

L'architecture de réseau de neurones qui sous-tend les LLMs modernes, basée sur l'attention auto-référentielle.

Multimodal

Modèles qui peuvent traiter et générer plusieurs types de média : texte, image, audio, vidéo.

Fine-tuning

Adapter un foundation model pré-entraîné sur des données spécifiques à une tâche pour améliorer la performance sur une tâche étroite.

LoRA (Low-Rank Adaptation)

Méthode de fine-tuning parameter-efficient qui entraîne de petits adapters au lieu du modèle complet.

Extended thinking

Un mode modèle qui exécute un reasoning interne plus long avant de produire la réponse.