LLMのTemperatureとは？ | GEO用語集

Temperatureとは、LLMが次のトークンをサンプリングする際に、その確率分布がどれだけ「鋭い」かを制御するパラメータです。低い値は、一貫性があり予測可能な出力を得るために、最も確率の高いトークンへと偏らせます。高い値は、確率の低いトークンもサンプリングできるようにし、より創造的で多様な応答を生み出します。ほとんどのAPIは0から2の値を受け付けます。

なぜ重要なのか

同じプロンプトでも、temperature 0.2と1.0では、トーン、長さ、創造性がまったく異なる出力になります。AIが生成するブログの下書きでは、低すぎると機械的で予測可能な文章になり、高すぎると事実誤認やハルシネーションが増えます。プロンプトエンジニアリングとあわせてtemperatureを意図的に設定することが、安定したAIコンテンツ品質の前提条件です。

範囲ごとの挙動

Temperature	特徴	適したタスク
0.0 – 0.2	決定論的、再現可能	分類、抽出、コード、事実QA
0.3 – 0.5	わずかな変化を伴い一貫	要約、翻訳、構造化された回答
0.6 – 0.8	自然な創造性	ブログの下書き、メール、マーケティングコピー
0.9 – 1.2	多様で創造的	アイデア出し、ブレインストーミング
1.3以上	ノイズが多く、ハルシネーションが増える	本番ではめったに使われない

Temperature vs Top-p

もう1つのよく使われるサンプリングパラメータが**top-p（核サンプリング）**で、これは累積確率がpに達するトークンのみを考慮します。

Temperatureは、確率分布全体を作り変えます。
Top-pは、候補プールの大きさを制限します。
両方を調整しないこと: OpenAIもAnthropicも、片方だけを調整することを推奨しています。両方を調整すると、挙動が予測不能になります。

タスク別の推奨値

事実ベースの記事（チュートリアル、ガイド）: 0.2 – 0.4。正確性を最優先し、創造性は最小限に。

ブログの下書き（エッセイ、分析）: 0.6 – 0.7。一貫した語り口の自然な文章。

アイデア出し（タイトル案、コピーの選択肢）: 0.9 – 1.0。多様性こそが目的。

要約と翻訳: 0.0 – 0.3。再現性が重要です。

FAQと定義: 0.0 – 0.2。同じ質問には同じ回答が返るべきです。

注意点

ハルシネーションとの相関: temperatureが高いほど、モデルは主要な学習分布の外側にあるトークンをより多くサンプリングし、事実誤認率が上がります。ハルシネーションに敏感なタスクでは、常にtemperatureを下げましょう。

再現性: temperature 0は完全に決定論的ではありません。同一の出力が必要なら、seedパラメータも固定しましょう。

デフォルト値: デフォルトはAPIによって異なります（OpenAI 1.0、Anthropic 1.0、Google ～1.0）。設定せずに呼び出すと、思っているよりも創造的な出力になります。

Sources: