Terme défini
LoRA (Low-Rank Adaptation)
Méthode de fine-tuning parameter-efficient qui entraîne de petits adapters au lieu du modèle complet.
LoRA gèle les poids du foundation model et entraîne de petites matrices low-rank qui modifient le comportement. Les adapters font 10-100MB (vs 200GB+ pour les poids complets), s'entraînent en heures vs jours, et peuvent être swappés à l'inference. La méthode de fine-tuning par défaut pour les équipes production en 2026.
Termes liés
Fine-tuning
Adapter un foundation model pré-entraîné sur des données spécifiques à une tâche pour améliorer la performance sur une tâche étroite.
Fenêtre de contexte
Quantité maximale de tokens (input + output) qu'un LLM peut traiter en un seul call.
Modèle frontier
Le modèle de plus haute capacité disponible chez un fournisseur, optimisé pour le reasoning à fort enjeu.
Foundation model
Grand modèle pré-entraîné qui sert de base à toutes les applications IA dans une famille de modèles.
On utilise ça chaque semaine
Réserver un appel de 30 min
Réservez un appel de 30 min et on vous montre comment LoRA (Low-Rank Adaptation) apparaît dans un engagement réel qu'on opère.
Réserver un appel de 30 min