Extended thinking

Un mode modèle qui exécute un reasoning interne plus long avant de produire la réponse.

L'extended thinking laisse le modèle allouer plus de compute d'inference au reasoning avant de répondre. Le plus utile pour les problèmes difficiles où la précision compte plus que la latence. Décision d'architecture : router seulement les cas les plus durs vers extended thinking, garder le trafic routinier sur les fast paths.

Termes liés

Chain of thought (CoT)

Technique de prompting qui pousse le modèle à montrer les étapes de raisonnement avant de produire la réponse finale.

Modèle frontier

Le modèle de plus haute capacité disponible chez un fournisseur, optimisé pour le reasoning à fort enjeu.

Fenêtre de contexte

Quantité maximale de tokens (input + output) qu'un LLM peut traiter en un seul call.

Foundation model

Grand modèle pré-entraîné qui sert de base à toutes les applications IA dans une famille de modèles.

On utilise ça chaque semaine

Réserver un appel de 30 min

Réservez un appel de 30 min et on vous montre comment Extended thinking apparaît dans un engagement réel qu'on opère.

Réserver un appel de 30 min