AI-Native Glossar

Definitionen, Kontexte und konkrete Beispiele der Begriffe, die wir jede Woche in AI-Native-Engagements verwenden. Muster: Definition → Wann es zählt → Realbeispiel → KPI.

Delivery & Betrieb

AI-native

Ein Delivery-Modell, bei dem KI die operative Schicht des Workflows ist — kein Feature, das oben drauf kommt.

KI-Workflow

Ein begrenzter operativer Prozess, bei dem KI definierte Schritte End-to-End mit messbaren KPIs handhabt.

Thin Slice

Ein schmaler, End-to-End-Produktions-Deployment, das einen KI-Workflow auf echten Daten und Edge-Cases beweist.

Discovery-Sprint

Ein bezahltes 2-Wochen-Engagement, das den Workflow, Baseline-Metriken, Systeme und das Risikomodell kartiert.

Architektur

Agentic AI

KI-Systeme, die planen, mehrstufige Aktionen ausführen und Tools nutzen, um Aufgaben autonom abzuschließen.

Autonomer Agent

Ein KI-Agent, der eine definierte Aufgabe ohne menschlichen Input bei jedem Schritt abschließt.

RAG (Retrieval-Augmented Generation)

Generierung verankert in abgerufenen Quelldokumenten statt nur in der parametrischen Modell-Memory.

Multi-LLM-Architektur

Routing verschiedener Aufgaben zu verschiedenen Modellen basierend auf Kosten-, Qualitäts-, Latenz- und Capability-Tradeoffs.

Embeddings

Dichte Vektorrepräsentationen von Text (oder anderen Daten), die semantische Bedeutung für Similarity-Search erfassen.

Vector-Store

Spezialisierte Datenbank zum Speichern und Suchen von Vektor-Embeddings im großen Maßstab.

Semantische Suche

Bedeutungsbasierte Suche statt exaktem Keyword-Matching.

Hybrid-Search

Kombination aus semantischer Suche (Embeddings) und Keyword-Suche (BM25) für bessere Ergebnisse als jede Methode allein.

Tool-Use

Fähigkeit eines LLM, deterministische Funktionen — APIs, Datenbanken, Code-Ausführung — als Teil seiner Antwort aufzurufen.

Function-Calling

Spezifische Implementation von Tool-Use, bei der das Modell strukturierte JSON-Calls zu registrierten Funktionen emittiert.

MCP (Model Context Protocol)

Standardprotokoll von Anthropic zur Verbindung von KI-Clients mit externen Tool- und Daten-Servern.

Structured Output

Modelle, die schema-konformes JSON statt Freitext zurückgeben, validiert zur Inference-Zeit.

ReAct

KI-Agent-Pattern, das Reasoning („Thought") und Aktionen („Action") für Multi-Step-Aufgaben abwechselt.

Chain of Thought (CoT)

Prompting-Technik, die das Modell drängt, Reasoning-Schritte zu zeigen bevor es die finale Antwort produziert.

Evaluierung & Qualität

Prompt-Versionierung

Prompts wie Code behandeln: gespeichert, diff'd, reviewed und rollback-fähig wie jedes Produktionsartefakt.

Evaluation-Harness

Automatisiertes Test-Framework, das KI-Outputs gegen ein labelled Test-Set vor Produktions-Promotion scort.

Labelled Test-Set

Eine Sammlung von Inputs mit erwarteten Outputs, verwendet zur Evaluation von Prompt-Versionen vor Promotion.

Confidence-Score

Ein Skalar, der schätzt, wie zuverlässig der Output eines Modells für einen gegebenen Input ist.

Governance & Risiko

Grounding

Modell-Output an verifizierbares Quellmaterial verankern, um Halluzinationen zu reduzieren.

Halluzination

Wenn ein LLM plausibel klingenden, aber faktisch falschen, erfundenen oder durch seine Quellen nicht gestützten Inhalt generiert.

Guardrails

Deterministische Validatoren, die ein Modell umhüllen, um bösartige Eingaben zu blockieren und Output-Konformität durchzusetzen.

Prompt-Injection

Angriff, bei dem bösartiger Input einen LLM manipuliert, Anweisungen zu ignorieren oder unbeabsichtigte Aktionen auszuführen.

KI-Governance

Richtlinien, Prozesse und Kontrollen, die ein KI-System auditierbar und rechenschaftspflichtig machen.

NIST AI RMF

Freiwilliges Framework des US-NIST zum Management von Risiken in KI-Systemen über den gesamten Lebenszyklus.

Model-Card

Dokumentation, die den vorgesehenen Use-Case, Limitationen, Evaluation und Risiken eines Modells beschreibt.

Audit-Log

Unveränderliche Aufzeichnung jedes Inference-Calls, jeder Aktion und jeder Reviewer-Entscheidung in einem KI-System.

Reviewer-Queue

Ein Workflow, bei dem KI-Outputs mit niedriger Confidence oder hohem Impact zur Freigabe an einen Menschen geroutet werden.

Modelle & Foundations

Context-Window

Maximale Menge an Tokens (Input + Output), die ein LLM in einem einzigen Call verarbeiten kann.

Frontier-Modell

Das höchstkapazitive Modell, das ein Anbieter zur Verfügung stellt, optimiert für Reasoning mit hohem Einsatz.

Foundation-Modell

Großes vortrainiertes Modell, das die Basis für alle KI-Anwendungen einer Modellfamilie bildet.

LLM (Large Language Model)

Ein großes Sprachmodell, trainiert auf massiven Textkorpora, fähig zu Generierung und Reasoning über Text.

Transformer

Die neuronale Netzwerkarchitektur, die modernen LLMs zugrunde liegt, basierend auf Self-Attention.

Multimodal

Modelle, die mehrere Medientypen verarbeiten und generieren können: Text, Bild, Audio, Video.

Fine-Tuning

Ein vortrainiertes Foundation-Modell auf aufgabenspezifischen Daten anpassen, um die Performance auf einer engen Aufgabe zu verbessern.

LoRA (Low-Rank Adaptation)

Parameter-effiziente Fine-Tuning-Methode, die kleine Adapter statt des vollen Modells trainiert.

Extended Thinking

Ein Modell-Modus, der längeres internes Reasoning durchführt bevor die Antwort produziert wird.