Fenêtre de contexte

Quantité maximale de tokens (input + output) qu'un LLM peut traiter en un seul call.

La context window plafonne combien le modèle peut « voir » à la fois. Les modèles modernes vont de 128k (GPT-4) à 1M+ (Gemini, Claude). Mais plus grand n'est pas toujours mieux : la recherche montre une dégradation au milieu des contextes longs (« Lost in the Middle »). Pour les workflows production, le retrieval ciblé bat souvent le full-context dumping au-dessus de 50k tokens.

Termes liés

LLM (Large Language Model)

Un grand modèle de langage entraîné sur des corpus textuels massifs, capable de générer et raisonner sur du texte.

RAG (Retrieval-Augmented Generation)

Génération ancrée dans des sources documentaires récupérées plutôt que dans la mémoire paramétrique seule du modèle.

Modèle frontier

Le modèle de plus haute capacité disponible chez un fournisseur, optimisé pour le reasoning à fort enjeu.

Foundation model

Grand modèle pré-entraîné qui sert de base à toutes les applications IA dans une famille de modèles.

On utilise ça chaque semaine

Réserver un appel de 30 min

Réservez un appel de 30 min et on vous montre comment Fenêtre de contexte apparaît dans un engagement réel qu'on opère.

Réserver un appel de 30 min