Terme défini
Extended thinking
Un mode modèle qui exécute un reasoning interne plus long avant de produire la réponse.
L'extended thinking laisse le modèle allouer plus de compute d'inference au reasoning avant de répondre. Le plus utile pour les problèmes difficiles où la précision compte plus que la latence. Décision d'architecture : router seulement les cas les plus durs vers extended thinking, garder le trafic routinier sur les fast paths.
Termes liés
Chain of thought (CoT)
Technique de prompting qui pousse le modèle à montrer les étapes de raisonnement avant de produire la réponse finale.
Modèle frontier
Le modèle de plus haute capacité disponible chez un fournisseur, optimisé pour le reasoning à fort enjeu.
Fenêtre de contexte
Quantité maximale de tokens (input + output) qu'un LLM peut traiter en un seul call.
Foundation model
Grand modèle pré-entraîné qui sert de base à toutes les applications IA dans une famille de modèles.
On utilise ça chaque semaine
Réserver un appel de 30 min
Réservez un appel de 30 min et on vous montre comment Extended thinking apparaît dans un engagement réel qu'on opère.
Réserver un appel de 30 min