Definierter Begriff
Context-Window
Maximale Menge an Tokens (Input + Output), die ein LLM in einem einzigen Call verarbeiten kann.
Das Context-Window begrenzt, wie viel das Modell auf einmal „sehen" kann. Moderne Modelle reichen von 128k (GPT-4) bis 1M+ (Gemini, Claude). Aber größer ist nicht immer besser: Forschung zeigt Degradation in der Mitte langer Contexts („Lost in the Middle"). Für Produktions-Workflows schlägt gezieltes Retrieval oft Full-Context-Dumping über 50k Tokens.
Verwandte Begriffe
LLM (Large Language Model)
Ein großes Sprachmodell, trainiert auf massiven Textkorpora, fähig zu Generierung und Reasoning über Text.
RAG (Retrieval-Augmented Generation)
Generierung verankert in abgerufenen Quelldokumenten statt nur in der parametrischen Modell-Memory.
Frontier-Modell
Das höchstkapazitive Modell, das ein Anbieter zur Verfügung stellt, optimiert für Reasoning mit hohem Einsatz.
Foundation-Modell
Großes vortrainiertes Modell, das die Basis für alle KI-Anwendungen einer Modellfamilie bildet.
Wir nutzen das jede Woche
30-Minuten-Gespräch buchen
Buchen Sie ein 30-Minuten-Gespräch und wir zeigen Ihnen, wie Context-Window in einem laufenden Engagement aussieht.
30-Minuten-Gespräch buchen