Context-Window

Maximale Menge an Tokens (Input + Output), die ein LLM in einem einzigen Call verarbeiten kann.

Das Context-Window begrenzt, wie viel das Modell auf einmal „sehen" kann. Moderne Modelle reichen von 128k (GPT-4) bis 1M+ (Gemini, Claude). Aber größer ist nicht immer besser: Forschung zeigt Degradation in der Mitte langer Contexts („Lost in the Middle"). Für Produktions-Workflows schlägt gezieltes Retrieval oft Full-Context-Dumping über 50k Tokens.

30-Minuten-Gespräch buchen

Buchen Sie ein 30-Minuten-Gespräch und wir zeigen Ihnen, wie Context-Window in einem laufenden Engagement aussieht.

30-Minuten-Gespräch buchen

Context-Window

Verwandte Begriffe

30-Minuten-Gespräch buchen