Fine-tuning
Le fine-tuning est la technique consistant à poursuivre l'entraînement d'un LLM pré-entraîné sur des données propres à un domaine ou à une tâche afin de façonner son style, ses connaissances et son comportement. C'est ainsi que l'on transforme un modèle généraliste en un « GPT personnalisé » propre à une marque ou à un secteur.
Le fine-tuning est la technique consistant à poursuivre l'entraînement d'un LLM pré-entraîné sur des données propres à un domaine ou à une tâche afin de façonner son style, ses connaissances et son comportement. C'est ainsi que l'on transforme un modèle généraliste en un « GPT personnalisé » propre à une marque ou à un secteur.
Pourquoi c'est important
Le prompt engineering a ses limites. Il répète les mêmes instructions à chaque requête, consomme de la fenêtre de contexte et ne peut pas verrouiller entièrement un style cohérent. Le fine-tuning met à jour les poids du modèle, de sorte que le comportement appris est intégré sans instructions explicites. Une recherche d'OpenAI montre qu'un GPT-4o fine-tuné atteint en moyenne une précision 20 à 30 % supérieure sur des tâches spécialisées par rapport au prompting seul.
Types de fine-tuning
Full fine-tuning : met à jour chaque paramètre. Les meilleures performances, mais le plus coûteux en calcul et en stockage.
LoRA (Low-Rank Adaptation) : conserve les poids d'origine figés et entraîne de petites couches d'adaptateurs. Environ 1/100 du coût d'entraînement, et vous pouvez permuter les adaptateurs LoRA selon les besoins. L'approche la plus répandue en 2026.
PEFT (Parameter-Efficient Fine-Tuning) : terme générique désignant LoRA, les adaptateurs, le Prefix-Tuning et des méthodes similaires, qui n'entraînent qu'un petit sous-ensemble de paramètres.
RLHF / DPO : règle la qualité des réponses à l'aide de retours humains ou de comparaisons de préférences. La technique d'alignement centrale derrière ChatGPT et Claude.
SFT (Supervised Fine-Tuning) : la forme la plus basique, à savoir l'entraînement sur des paires entrée-sortie étiquetées. Efficace pour enseigner des formats ou des tons précis.
Fine-tuning vs prompting vs RAG
Ces approches sont complémentaires, et non concurrentes.
| Objectif | Meilleure approche |
|---|---|
| Style/ton cohérent | Fine-tuning |
| Respect du format ou de la langue | Fine-tuning ou prompting |
| Information fraîche en temps réel | RAG |
| Documents internes à l'entreprise | RAG |
| Connaissances approfondies d'un domaine (médical, juridique) | Fine-tuning + RAG |
| Tâches ponctuelles ou changeantes | Prompting |
Règle empirique : si le prompting résout le problème, le fine-tuning est superflu. N'optez pour le fine-tuning que lorsque vous répétez sans cesse les mêmes instructions ou que vous n'obtenez pas un ton cohérent.
Conseils pratiques
La qualité des données prime sur tout : 1 000 exemples de haute qualité l'emportent sur 10 000 exemples bruités. La cohérence et la diversité des étiquettes déterminent la performance finale.
Taille minimale des données : OpenAI recommande au moins 50 à 100 exemples ; 500 à 1 000 est typique en pratique. LoRA fonctionne avec moins.
Réservez un jeu de validation : mettez de côté 10 à 20 % des données pour détecter le surapprentissage.
Partez du plus petit modèle de base capable : un petit modèle bien fine-tuné l'emporte souvent sur un grand modèle prompté, tant en vitesse qu'en coût.
Définissez d'abord les métriques d'évaluation : décidez de la manière dont vous mesurerez la précision, la cohérence du style et la factualité avant l'entraînement afin de pouvoir suivre les progrès.
Sources :