GEO

Temperature

Temperatureとは、LLMが次のトークンをサンプリングする際に、その確率分布がどれだけ「鋭い」かを制御するパラメータです。低い値は、一貫性があり予測可能な出力を得るために、最も確率の高いトークンへと偏らせます。高い値は、確率の低いトークンもサンプリングできるようにし、より創造的で多様な応答を生み出します。ほとんどのAPIは0から2の値を受け付けます。

Temperatureとは、LLMが次のトークンをサンプリングする際に、その確率分布がどれだけ「鋭い」かを制御するパラメータです。低い値は、一貫性があり予測可能な出力を得るために、最も確率の高いトークンへと偏らせます。高い値は、確率の低いトークンもサンプリングできるようにし、より創造的で多様な応答を生み出します。ほとんどのAPIは0から2の値を受け付けます。

なぜ重要なのか

同じプロンプトでも、temperature 0.2と1.0では、トーン、長さ、創造性がまったく異なる出力になります。AIが生成するブログの下書きでは、低すぎると機械的で予測可能な文章になり、高すぎると事実誤認やハルシネーションが増えます。プロンプトエンジニアリングとあわせてtemperatureを意図的に設定することが、安定したAIコンテンツ品質の前提条件です。

範囲ごとの挙動

Temperature特徴適したタスク
0.0 – 0.2決定論的、再現可能分類、抽出、コード、事実QA
0.3 – 0.5わずかな変化を伴い一貫要約、翻訳、構造化された回答
0.6 – 0.8自然な創造性ブログの下書き、メール、マーケティングコピー
0.9 – 1.2多様で創造的アイデア出し、ブレインストーミング
1.3以上ノイズが多く、ハルシネーションが増える本番ではめったに使われない

Temperature vs Top-p

もう1つのよく使われるサンプリングパラメータが**top-p(核サンプリング)**で、これは累積確率がpに達するトークンのみを考慮します。

  • Temperatureは、確率分布全体を作り変えます。
  • Top-pは、候補プールの大きさを制限します。
  • 両方を調整しないこと: OpenAIもAnthropicも、片方だけを調整することを推奨しています。両方を調整すると、挙動が予測不能になります。

タスク別の推奨値

事実ベースの記事(チュートリアル、ガイド): 0.2 – 0.4。正確性を最優先し、創造性は最小限に。

ブログの下書き(エッセイ、分析): 0.6 – 0.7。一貫した語り口の自然な文章。

アイデア出し(タイトル案、コピーの選択肢): 0.9 – 1.0。多様性こそが目的。

要約と翻訳: 0.0 – 0.3。再現性が重要です。

FAQと定義: 0.0 – 0.2。同じ質問には同じ回答が返るべきです。

注意点

ハルシネーションとの相関: temperatureが高いほど、モデルは主要な学習分布の外側にあるトークンをより多くサンプリングし、事実誤認率が上がります。ハルシネーションに敏感なタスクでは、常にtemperatureを下げましょう。

再現性: temperature 0は完全に決定論的ではありません。同一の出力が必要なら、seedパラメータも固定しましょう。

デフォルト値: デフォルトはAPIによって異なります(OpenAI 1.0、Anthropic 1.0、Google ~1.0)。設定せずに呼び出すと、思っているよりも創造的な出力になります。

Sources: