Chaîne de pensée
La chaîne de pensée (Chain-of-Thought, CoT) est une technique de prompting qui amène un LLM à générer un processus de raisonnement étape par étape avant sa réponse finale. Formalisée par Wei et al. chez Google Research en 2022, elle est devenue la technique de référence pour améliorer la précision des LLM sur les tâches de raisonnement complexes.
La chaîne de pensée (Chain-of-Thought, CoT) est une technique de prompting qui amène un LLM à générer un processus de raisonnement étape par étape avant sa réponse finale. Formalisée par Wei et al. chez Google Research en 2022, elle est devenue la technique de référence pour améliorer la précision des LLM sur les tâches de raisonnement complexes.
Pourquoi c'est important
Les premiers LLM avaient du mal avec l'arithmétique, la logique et le raisonnement en plusieurs étapes. Dans l'article original de Wei, PaLM 540B ne résolvait que 17,9 % des problèmes du benchmark de mathématiques de primaire GSM8K avec un prompting de base, mais 56,9 % avec la chaîne de pensée. Même modèle, mêmes questions, une précision 2 à 3 fois meilleure simplement en donnant au modèle de « l'espace pour réfléchir ». Depuis, Claude, GPT et Gemini ont tous intégré la CoT comme schéma de prompting central.
Comment ça fonctionne
L'idée centrale de la CoT est de faire dérouler au LLM son raisonnement d'abord, puis d'énoncer la conclusion, au lieu de sauter directement à une réponse. Comme les transformeurs conditionnent chaque token sur les tokens précédents, émettre un raisonnement intermédiaire place ce contenu dans le contexte et augmente la qualité de la réponse finale. Plus de « tokens de réflexion » donnent au modèle plus d'« espace de raisonnement ».
Principales variantes
Zero-Shot CoT : ajoutez une seule ligne comme « Réfléchissons étape par étape », sans exemple. Proposée par Kojima et al. en 2022, c'est la forme la plus simple et étonnamment efficace.
Few-Shot CoT : incluez 2 à 3 problèmes d'exemple avec leur raisonnement étape par étape dans le prompt pour que le modèle en imite la structure.
Auto-cohérence (Self-Consistency) : échantillonnez plusieurs réponses CoT pour la même question et retenez la conclusion finale la plus fréquente, soit un « vote » sur les chemins de raisonnement, plus précis qu'une seule CoT.
Arbre de pensées (Tree of Thoughts, ToT) : explorez le raisonnement sous forme d'arbre plutôt que de ligne, en ne développant que les branches les mieux notées. Adapté à la planification complexe et aux énigmes.
ReAct : Reasoning + Acting (raisonner + agir). Combine la CoT avec des appels d'outils dans une boucle « penser → agir → observer → penser à nouveau ». Le schéma de prompting de référence pour les agents IA.
Quand la CoT aide
La CoT n'aide pas de manière égale sur toutes les tâches.
Très efficace : mathématiques, énigmes logiques, raisonnement en plusieurs étapes, prises de décision complexes, débogage de code.
Moins efficace : classification simple, analyse de sentiment, résumé et traduction, où la réponse est déjà immédiate et où la CoT ne fait surtout qu'ajouter de la latence.
Tendance 2026 : les modèles de pointe sont désormais livrés avec des « modes de raisonnement » intégrés (OpenAI o1, réflexion étendue de Claude Opus) qui exécutent la CoT automatiquement, si bien que les utilisateurs n'ont plus besoin de rédiger manuellement des prompts CoT. L'attention se porte vers d'autres indices d'amélioration de la qualité.
Implications GEO
La CoT n'est pas une technique que les rédacteurs de contenu appliquent directement, mais elle façonne le contenu que les LLM trouvent le plus facile à citer. Si un article de blog déroule des concepts complexes avec une logique explicite étape par étape, les LLM utilisent plus facilement cette section comme ancrage pour leur propre raisonnement. Les explications qui détaillent « pourquoi cela découle » l'emportent sur les conclusions en une seule ligne lorsque la recherche IA choisit ce qu'elle va citer.
Sources :