Zurück zum Glossar/Modelle & Foundations

Definierter Begriff

Multimodal

Modelle, die mehrere Medientypen verarbeiten und generieren können: Text, Bild, Audio, Video.

Multimodale Modelle (Claude 4, GPT-4o, Gemini) akzeptieren als Input und reasonen über Text plus Bilder, Audio oder Video. Für Produktions-Workflows ermöglicht Multimodal neue Use-Cases: Schadensfoto-Analyse in der Versicherung, Screenshots im Support, Videos in der Content-Moderation.

Verwandte Begriffe

Wir nutzen das jede Woche

30-Minuten-Gespräch buchen

Buchen Sie ein 30-Minuten-Gespräch und wir zeigen Ihnen, wie Multimodal in einem laufenden Engagement aussieht.

30-Minuten-Gespräch buchen