GEO

フューショット学習

フューショット学習とは、LLMにパターンを模倣させるために、2〜5組の「入力 → 望ましい出力」の例をプロンプトに含めるプロンプトエンジニアリングの手法です。追加の学習なしで、プロンプト設計だけでモデルの振る舞いを揃える、最も実践的な方法の1つです。

フューショット学習とは、LLMにパターンを模倣させるために、2〜5組の「入力 → 望ましい出力」の例をプロンプトに含めるプロンプトエンジニアリングの手法です。追加の学習なしで、プロンプト設計だけでモデルの振る舞いを揃える、最も実践的な方法の1つです。

なぜ重要なのか

2020年のGPT-3論文「Language Models are Few-Shot Learners」で体系的に紹介されたこの手法は、大規模なLLMがわずかな例を見ただけで、明示的に学習したことのないタスクを実行できることを示しました。同じタスクでの精度は、ゼロショットと比べてフューショットのほうが平均で20〜40%高くなります。ファインチューニングなしで得られる、最も安価で意味のある品質改善です。

ゼロショット vs フューショット vs ファインチューニング

ゼロショット: 指示のみで、例はなし。

「この文の感情をポジティブ/ネガティブ/ニュートラルに分類して: [文]」

フューショット: 2〜5組の例を含める。

「ポジティブ、ネガティブ、ニュートラルのいずれかに分類して。 例1: 『本当に素晴らしかった』 → ポジティブ 例2: 『私には合わない』 → ネガティブ 例3: 『まあまあだった』 → ニュートラル 分類する文: [新しい文]」

ファインチューニング: 数百から数千の例でモデルの重みを更新する。

観点ゼロショットフューショットファインチューニング
セットアップコストなし数分数時間〜数日
精度
トークン消費中(例がプロンプトを膨らませる)低(学習後)
柔軟性即座に変更可能即座に変更可能再学習が必要

フューショットはその2つの中間に位置し、「素早い品質向上が必要なほとんどの本番タスク」にとっての最適点です。

効果的なフューショットの例を設計する

多様なケースを網羅する: ポジティブ、ネガティブ、エッジケースを含め、モデルが分布を推論できるようにします。

一貫した形式: すべての例が同じ入力 → 出力の形式に従う必要があります。形式が一貫していないと精度が落ちます。

難しい境界ケース: 簡単な例だけでは、モデルは境界で確信を持てません。「ポジティブに見えるが実際はニュートラル」のような微妙なケースを含めましょう。

例の順序: 順序が結果に影響することが研究で示されています。一般的な経験則は、最も明確な例を先に、その後に難しい例を置くことです。

例の数: ほとんどのタスクでは3〜5個が最適です。それ以上は通常、トークンコストが増えるだけで効果は逓減します。

適したユースケース

分類: 顧客からの問い合わせをカテゴリー別に自動ラベル付けする。

形式変換: JSONからMarkdownへ、非構造化テキストから構造化データへ。

スタイルの模倣: わずかな例からブランドボイスや著者の文体を学ぶ。

ドメイン固有の抽出: 契約書や論文から特定のフィールドを抽出する。

翻訳の調整: 自社の用語集を含むように翻訳をカスタマイズする。

制約

コンテキストの浪費: 長い例はトークンを消費し、実効的なコンテキストウィンドウを縮小させます。

ファインチューニングより一貫性が低い: 大量に繰り返すタスクでは、依然としてファインチューニングが有利です。

最新のモデルはゼロショットが得意: Claude Opus 4.6、GPT-5などのフロンティアモデルはゼロショットの差の多くを埋めるため、フューショットの優位性は以前より小さくなっています。ゼロショットで十分なことも多いです。

例の品質が出力を決める: 悪い例 → 悪い出力。例の設計が品質の中核となるレバーです。

Sources: