Waimia.
§ IA · TECHNIQUE

Température LLM

La température règle le niveau d'aléatoire du LLM. Proche de 0 pour l'extraction de données fiable ; plus haute pour la génération créative.

§ Définition

Paramètre numérique (généralement entre 0 et 2) qui contrôle la variabilité des réponses générées par un LLM : une température basse produit des réponses déterministes et prévisibles, une température haute favorise la créativité et la diversité au prix d'une moindre cohérence.

§ Exemples
  • Pour classifier des emails entrants en catégories prédéfinies, on utilisera temperature=0 afin d'obtenir des résultats cohérents et reproductibles.
  • Pour générer des variantes de copywriting ou des slogans publicitaires, une temperature=0.9 favorise la diversité et l'originalité des propositions.
  • Un agent de résumé de comptes rendus de réunion fonctionnera idéalement entre temperature=0.1 et 0.3 : fidèle aux faits, sans hallucinations créatives.
§ Termes liés

La température : le curseur créativité/fiabilité des LLM

La température est le paramètre de configuration le plus impactant sur le comportement d’un LLM en production. Mal calibrée, elle génère soit des réponses monotones et répétitives, soit des hallucinations créatives incontrôlées.

Comprendre le mécanisme

À chaque génération de token, le LLM calcule une distribution de probabilité sur l’ensemble de son vocabulaire. La température modifie cette distribution :

  • Temperature = 0 : le modèle choisit systématiquement le token le plus probable. Les réponses sont identiques pour une même entrée. Idéal pour l’extraction structurée, la classification, l’analyse de données.
  • Temperature = 0.7 : légère variabilité. Bon équilibre pour la rédaction professionnelle, les résumés, les réponses de support client.
  • Temperature ≥ 1 : forte créativité. Utile pour le brainstorming, la génération de contenus marketing variés, la fiction.

Recommandations pratiques

Pour les workflows en production, préférez une température basse (0 à 0.3) dès que la cohérence et la reproductibilité sont des critères d’évaluation. Réservez les températures élevées aux phases de génération créative où la diversité prime sur la précision.

Certains modèles proposent aussi un paramètre top_p complémentaire, qui limite la sélection aux tokens les plus probables cumulant un pourcentage donné de la distribution, une alternative plus fine que la seule température.