LoRA (Low-Rank Adaptation)

Méthode de fine-tuning parameter-efficient qui entraîne de petits adapters au lieu du modèle complet.

LoRA gèle les poids du foundation model et entraîne de petites matrices low-rank qui modifient le comportement. Les adapters font 10-100MB (vs 200GB+ pour les poids complets), s'entraînent en heures vs jours, et peuvent être swappés à l'inference. La méthode de fine-tuning par défaut pour les équipes production en 2026.

Termes liés

Fine-tuning

Adapter un foundation model pré-entraîné sur des données spécifiques à une tâche pour améliorer la performance sur une tâche étroite.

Fenêtre de contexte

Quantité maximale de tokens (input + output) qu'un LLM peut traiter en un seul call.

Modèle frontier

Le modèle de plus haute capacité disponible chez un fournisseur, optimisé pour le reasoning à fort enjeu.

Foundation model

Grand modèle pré-entraîné qui sert de base à toutes les applications IA dans une famille de modèles.

On utilise ça chaque semaine

Réserver un appel de 30 min

Réservez un appel de 30 min et on vous montre comment LoRA (Low-Rank Adaptation) apparaît dans un engagement réel qu'on opère.

Réserver un appel de 30 min