O que e Few-Shot Learning? | Glossario GEO

Few-shot learning e a tecnica de engenharia de prompt que inclui de 2 a 5 exemplos de "entrada -> saida desejada" no prompt para que o LLM imite o padrao. Sem nenhum treinamento adicional, e uma das formas mais praticas de alinhar o comportamento do modelo apenas com o design do prompt.

Por que isso importa

Apresentada de forma sistematica no artigo do GPT-3 de 2020, "Language Models are Few-Shot Learners", a tecnica demonstrou que grandes LLMs conseguiam realizar tarefas para as quais nunca haviam sido treinados explicitamente apos verem apenas alguns exemplos. A precisao na mesma tarefa e, em media, de 20% a 40% maior com few-shot em comparacao com zero-shot. E a melhoria de qualidade significativa mais barata disponivel sem fine-tuning.

Zero-Shot vs Few-Shot vs Fine-Tuning

Zero-Shot: Apenas instrucoes, sem exemplos.

"Classifique o sentimento desta frase como positivo/negativo/neutro: [frase]"

Few-Shot: De 2 a 5 pares de exemplo incluidos.

"Classifique como positivo, negativo ou neutro. Exemplo 1: 'Foi muito bom mesmo' -> positivo Exemplo 2: 'Nao e para mim' -> negativo Exemplo 3: 'Foi ok' -> neutro Frase a classificar: [nova frase]"

Fine-Tuning: Atualizar os pesos do modelo com centenas a milhares de exemplos.

Aspecto	Zero-Shot	Few-Shot	Fine-Tuning
Custo de configuracao	Nenhum	Minutos	Horas a dias
Precisao	Baixa	Media	Alta
Consumo de tokens	Baixo	Medio (os exemplos inflam o prompt)	Baixo (apos o treinamento)
Flexibilidade	Muda instantaneamente	Muda instantaneamente	Requer retreinamento

O few-shot fica entre os dois, e e o ponto ideal para "a maioria das tarefas de producao que precisam de um aumento rapido de qualidade".

Como criar exemplos eficazes de few-shot

Cubra casos diversos: Inclua casos positivos, negativos e limitrofes para que o modelo infira a distribuicao.

Formato consistente: Todo exemplo deve seguir o mesmo formato de entrada -> saida. Formatos inconsistentes prejudicam a precisao.

Casos de fronteira dificeis: Exemplos faceis deixam o modelo inseguro nos limites. Inclua casos sutis como "parece positivo, mas na verdade e neutro".

Ordenacao dos exemplos: Pesquisas mostram que a ordenacao afeta os resultados. Uma heuristica comum e colocar os exemplos mais claros primeiro e depois os mais dificeis.

Numero de exemplos: De 3 a 5 e o ideal para a maioria das tarefas. Mais do que isso geralmente adiciona custo de tokens com retorno decrescente.

Bons casos de uso

Classificacao: Rotulagem automatica de consultas de clientes por categoria.

Conversao de formato: De JSON para Markdown, de texto nao estruturado para dados estruturados.

Imitacao de estilo: Aprender uma voz de marca ou a prosa de um autor a partir de poucos exemplos.

Extracao especifica de dominio: Extrair campos especificos de contratos ou artigos.

Ajuste de traducao: Personalizar a traducao para incluir o seu glossario.

Limitacoes

Desperdicio de contexto: Exemplos longos consomem tokens e reduzem a janela de contexto efetiva.

Menos consistente que o fine-tuning: Tarefas repetitivas de alto volume ainda favorecem o fine-tuning.

Modelos modernos sao melhores em zero-shot: Claude Opus 4.8, GPT-5.5 e modelos de fronteira similares fecham boa parte da diferenca do zero-shot, entao a vantagem do few-shot e menor do que era. Muitas vezes o zero-shot basta.

A qualidade dos exemplos determina a saida: Exemplos ruins -> saidas ruins. O design dos exemplos e a alavanca central de qualidade.

Fontes: