Retour au glossaire/Modèles & fondations

Terme défini

Fenêtre de contexte

Quantité maximale de tokens (input + output) qu'un LLM peut traiter en un seul call.

La context window plafonne combien le modèle peut « voir » à la fois. Les modèles modernes vont de 128k (GPT-4) à 1M+ (Gemini, Claude). Mais plus grand n'est pas toujours mieux : la recherche montre une dégradation au milieu des contextes longs (« Lost in the Middle »). Pour les workflows production, le retrieval ciblé bat souvent le full-context dumping au-dessus de 50k tokens.

Termes liés

On utilise ça chaque semaine

Réserver un appel de 30 min

Réservez un appel de 30 min et on vous montre comment Fenêtre de contexte apparaît dans un engagement réel qu'on opère.

Réserver un appel de 30 min