Retour au glossaire/Modèles & fondations

Terme défini

Multimodal

Modèles qui peuvent traiter et générer plusieurs types de média : texte, image, audio, vidéo.

Les modèles multimodaux (Claude 4, GPT-4o, Gemini) acceptent en input et raisonnent sur du texte plus des images, audio ou vidéo. Pour les workflows production, le multimodal active de nouveaux use cases : analyse de photos de dégâts en sinistres, screenshots dans le support, vidéos dans la modération de contenu.

Termes liés

On utilise ça chaque semaine

Réserver un appel de 30 min

Réservez un appel de 30 min et on vous montre comment Multimodal apparaît dans un engagement réel qu'on opère.

Réserver un appel de 30 min