Temperature
Temperatureとは、LLMが次のトークンをサンプリングする際に、その確率分布がどれだけ「鋭い」かを制御するパラメータです。低い値は、一貫性があり予測可能な出力を得るために、最も確率の高いトークンへと偏らせます。高い値は、確率の低いトークンもサンプリングできるようにし、より創造的で多様な応答を生み出します。ほとんどのAPIは0から2の値を受け付けます。
Temperatureとは、LLMが次のトークンをサンプリングする際に、その確率分布がどれだけ「鋭い」かを制御するパラメータです。低い値は、一貫性があり予測可能な出力を得るために、最も確率の高いトークンへと偏らせます。高い値は、確率の低いトークンもサンプリングできるようにし、より創造的で多様な応答を生み出します。ほとんどのAPIは0から2の値を受け付けます。
なぜ重要なのか
同じプロンプトでも、temperature 0.2と1.0では、トーン、長さ、創造性がまったく異なる出力になります。AIが生成するブログの下書きでは、低すぎると機械的で予測可能な文章になり、高すぎると事実誤認やハルシネーションが増えます。プロンプトエンジニアリングとあわせてtemperatureを意図的に設定することが、安定したAIコンテンツ品質の前提条件です。
範囲ごとの挙動
| Temperature | 特徴 | 適したタスク |
|---|---|---|
| 0.0 – 0.2 | 決定論的、再現可能 | 分類、抽出、コード、事実QA |
| 0.3 – 0.5 | わずかな変化を伴い一貫 | 要約、翻訳、構造化された回答 |
| 0.6 – 0.8 | 自然な創造性 | ブログの下書き、メール、マーケティングコピー |
| 0.9 – 1.2 | 多様で創造的 | アイデア出し、ブレインストーミング |
| 1.3以上 | ノイズが多く、ハルシネーションが増える | 本番ではめったに使われない |
Temperature vs Top-p
もう1つのよく使われるサンプリングパラメータが**top-p(核サンプリング)**で、これは累積確率がpに達するトークンのみを考慮します。
- Temperatureは、確率分布全体を作り変えます。
- Top-pは、候補プールの大きさを制限します。
- 両方を調整しないこと: OpenAIもAnthropicも、片方だけを調整することを推奨しています。両方を調整すると、挙動が予測不能になります。
タスク別の推奨値
事実ベースの記事(チュートリアル、ガイド): 0.2 – 0.4。正確性を最優先し、創造性は最小限に。
ブログの下書き(エッセイ、分析): 0.6 – 0.7。一貫した語り口の自然な文章。
アイデア出し(タイトル案、コピーの選択肢): 0.9 – 1.0。多様性こそが目的。
要約と翻訳: 0.0 – 0.3。再現性が重要です。
FAQと定義: 0.0 – 0.2。同じ質問には同じ回答が返るべきです。
注意点
ハルシネーションとの相関: temperatureが高いほど、モデルは主要な学習分布の外側にあるトークンをより多くサンプリングし、事実誤認率が上がります。ハルシネーションに敏感なタスクでは、常にtemperatureを下げましょう。
再現性: temperature 0は完全に決定論的ではありません。同一の出力が必要なら、seedパラメータも固定しましょう。
デフォルト値: デフォルトはAPIによって異なります(OpenAI 1.0、Anthropic 1.0、Google ~1.0)。設定せずに呼び出すと、思っているよりも創造的な出力になります。
Sources: