AI-Native Glossar
Definitionen, Kontexte und konkrete Beispiele der Begriffe, die wir jede Woche in AI-Native-Engagements verwenden. Muster: Definition → Wann es zählt → Realbeispiel → KPI.
Delivery & Betrieb
AI-native
Ein Delivery-Modell, bei dem KI die operative Schicht des Workflows ist — kein Feature, das oben drauf kommt.
KI-Workflow
Ein begrenzter operativer Prozess, bei dem KI definierte Schritte End-to-End mit messbaren KPIs handhabt.
Thin Slice
Ein schmaler, End-to-End-Produktions-Deployment, das einen KI-Workflow auf echten Daten und Edge-Cases beweist.
Discovery-Sprint
Ein bezahltes 2-Wochen-Engagement, das den Workflow, Baseline-Metriken, Systeme und das Risikomodell kartiert.
Architektur
Agentic AI
KI-Systeme, die planen, mehrstufige Aktionen ausführen und Tools nutzen, um Aufgaben autonom abzuschließen.
Autonomer Agent
Ein KI-Agent, der eine definierte Aufgabe ohne menschlichen Input bei jedem Schritt abschließt.
RAG (Retrieval-Augmented Generation)
Generierung verankert in abgerufenen Quelldokumenten statt nur in der parametrischen Modell-Memory.
Multi-LLM-Architektur
Routing verschiedener Aufgaben zu verschiedenen Modellen basierend auf Kosten-, Qualitäts-, Latenz- und Capability-Tradeoffs.
Embeddings
Dichte Vektorrepräsentationen von Text (oder anderen Daten), die semantische Bedeutung für Similarity-Search erfassen.
Vector-Store
Spezialisierte Datenbank zum Speichern und Suchen von Vektor-Embeddings im großen Maßstab.
Semantische Suche
Bedeutungsbasierte Suche statt exaktem Keyword-Matching.
Hybrid-Search
Kombination aus semantischer Suche (Embeddings) und Keyword-Suche (BM25) für bessere Ergebnisse als jede Methode allein.
Tool-Use
Fähigkeit eines LLM, deterministische Funktionen — APIs, Datenbanken, Code-Ausführung — als Teil seiner Antwort aufzurufen.
Function-Calling
Spezifische Implementation von Tool-Use, bei der das Modell strukturierte JSON-Calls zu registrierten Funktionen emittiert.
MCP (Model Context Protocol)
Standardprotokoll von Anthropic zur Verbindung von KI-Clients mit externen Tool- und Daten-Servern.
Structured Output
Modelle, die schema-konformes JSON statt Freitext zurückgeben, validiert zur Inference-Zeit.
ReAct
KI-Agent-Pattern, das Reasoning („Thought") und Aktionen („Action") für Multi-Step-Aufgaben abwechselt.
Chain of Thought (CoT)
Prompting-Technik, die das Modell drängt, Reasoning-Schritte zu zeigen bevor es die finale Antwort produziert.
Evaluierung & Qualität
Prompt-Versionierung
Prompts wie Code behandeln: gespeichert, diff'd, reviewed und rollback-fähig wie jedes Produktionsartefakt.
Evaluation-Harness
Automatisiertes Test-Framework, das KI-Outputs gegen ein labelled Test-Set vor Produktions-Promotion scort.
Labelled Test-Set
Eine Sammlung von Inputs mit erwarteten Outputs, verwendet zur Evaluation von Prompt-Versionen vor Promotion.
Confidence-Score
Ein Skalar, der schätzt, wie zuverlässig der Output eines Modells für einen gegebenen Input ist.
Governance & Risiko
Grounding
Modell-Output an verifizierbares Quellmaterial verankern, um Halluzinationen zu reduzieren.
Halluzination
Wenn ein LLM plausibel klingenden, aber faktisch falschen, erfundenen oder durch seine Quellen nicht gestützten Inhalt generiert.
Guardrails
Deterministische Validatoren, die ein Modell umhüllen, um bösartige Eingaben zu blockieren und Output-Konformität durchzusetzen.
Prompt-Injection
Angriff, bei dem bösartiger Input einen LLM manipuliert, Anweisungen zu ignorieren oder unbeabsichtigte Aktionen auszuführen.
KI-Governance
Richtlinien, Prozesse und Kontrollen, die ein KI-System auditierbar und rechenschaftspflichtig machen.
NIST AI RMF
Freiwilliges Framework des US-NIST zum Management von Risiken in KI-Systemen über den gesamten Lebenszyklus.
Model-Card
Dokumentation, die den vorgesehenen Use-Case, Limitationen, Evaluation und Risiken eines Modells beschreibt.
Audit-Log
Unveränderliche Aufzeichnung jedes Inference-Calls, jeder Aktion und jeder Reviewer-Entscheidung in einem KI-System.
Reviewer-Queue
Ein Workflow, bei dem KI-Outputs mit niedriger Confidence oder hohem Impact zur Freigabe an einen Menschen geroutet werden.
Modelle & Foundations
Context-Window
Maximale Menge an Tokens (Input + Output), die ein LLM in einem einzigen Call verarbeiten kann.
Frontier-Modell
Das höchstkapazitive Modell, das ein Anbieter zur Verfügung stellt, optimiert für Reasoning mit hohem Einsatz.
Foundation-Modell
Großes vortrainiertes Modell, das die Basis für alle KI-Anwendungen einer Modellfamilie bildet.
LLM (Large Language Model)
Ein großes Sprachmodell, trainiert auf massiven Textkorpora, fähig zu Generierung und Reasoning über Text.
Transformer
Die neuronale Netzwerkarchitektur, die modernen LLMs zugrunde liegt, basierend auf Self-Attention.
Multimodal
Modelle, die mehrere Medientypen verarbeiten und generieren können: Text, Bild, Audio, Video.
Fine-Tuning
Ein vortrainiertes Foundation-Modell auf aufgabenspezifischen Daten anpassen, um die Performance auf einer engen Aufgabe zu verbessern.
LoRA (Low-Rank Adaptation)
Parameter-effiziente Fine-Tuning-Methode, die kleine Adapter statt des vollen Modells trainiert.
Extended Thinking
Ein Modell-Modus, der längeres internes Reasoning durchführt bevor die Antwort produziert wird.