GEO

Aprendizaje Few-Shot

El aprendizaje few-shot es la técnica de ingeniería de prompts que consiste en incluir de 2 a 5 ejemplos de "entrada → salida deseada" en el prompt para que el LLM imite el patrón. Sin entrenamiento adicional, es una de las formas más prácticas de alinear el comportamiento del modelo solo mediante el diseño del prompt.

El aprendizaje few-shot es la técnica de ingeniería de prompts que consiste en incluir de 2 a 5 ejemplos de "entrada → salida deseada" en el prompt para que el LLM imite el patrón. Sin entrenamiento adicional, es una de las formas más prácticas de alinear el comportamiento del modelo solo mediante el diseño del prompt.

Por qué importa

Introducida de forma sistemática en el artículo de 2020 sobre GPT-3 "Los modelos de lenguaje son aprendices few-shot", la técnica demostró que los grandes LLM podían realizar tareas para las que nunca habían sido entrenados explícitamente tras ver solo unos pocos ejemplos. La precisión en una misma tarea promedia entre un 20 % y un 40 % más alta con few-shot que con zero-shot. Es la mejora de calidad significativa más barata disponible sin fine-tuning.

Zero-shot vs few-shot vs fine-tuning

Zero-shot: Solo instrucciones, sin ejemplos.

"Clasifica el sentimiento de esta oración como positivo/negativo/neutral: [oración]"

Few-shot: De 2 a 5 pares de ejemplos incluidos.

"Clasifica como positivo, negativo o neutral. Ejemplo 1: 'Estuvo realmente genial' → positivo Ejemplo 2: 'No es para mí' → negativo Ejemplo 3: 'Estuvo bien' → neutral Oración a clasificar: [nueva oración]"

Fine-tuning: Actualiza los pesos del modelo con cientos o miles de ejemplos.

AspectoZero-shotFew-shotFine-tuning
Costo de configuraciónNingunoMinutosDe horas a días
PrecisiónBajaMediaAlta
Consumo de tokensBajoMedio (los ejemplos inflan el prompt)Bajo (tras el entrenamiento)
FlexibilidadCambio instantáneoCambio instantáneoRequiere reentrenamiento

El few-shot se sitúa entre los dos, y es el punto ideal para "la mayoría de las tareas de producción que necesitan un impulso rápido de calidad".

Cómo diseñar ejemplos few-shot efectivos

Cubre casos diversos: Incluye positivos, negativos y casos límite para que el modelo infiera la distribución.

Formato consistente: Cada ejemplo debe seguir el mismo formato de entrada → salida. Los formatos inconsistentes perjudican la precisión.

Casos límite difíciles: Los ejemplos fáciles dejan al modelo inseguro en los límites. Incluye casos sutiles como "parece positivo pero en realidad es neutral".

Orden de los ejemplos: La investigación muestra que el orden afecta los resultados. Una heurística común es poner primero los ejemplos más claros y luego los más difíciles.

Número de ejemplos: De 3 a 5 es lo óptimo para la mayoría de las tareas. Más suele añadir costo de tokens con rendimientos decrecientes.

Buenos casos de uso

Clasificación: Etiquetado automático de consultas de clientes por categoría.

Conversión de formato: De JSON a Markdown, de texto no estructurado a datos estructurados.

Imitación de estilo: Aprender una voz de marca o la prosa de un autor a partir de un puñado de ejemplos.

Extracción específica de dominio: Extraer campos específicos de contratos o artículos.

Ajuste de traducción: Personalizar la traducción para incluir tu glosario.

Limitaciones

Desperdicio de contexto: Los ejemplos largos consumen tokens y reducen la ventana de contexto efectiva.

Menos consistente que el fine-tuning: Las tareas repetitivas de alto volumen todavía favorecen el fine-tuning.

Los modelos modernos son mejores en zero-shot: Claude Opus 4.6, GPT-5 y otros modelos de frontera similares cierran gran parte de la brecha del zero-shot, por lo que la ventaja del few-shot es menor de lo que era. A menudo el zero-shot es suficiente.

La calidad de los ejemplos determina la salida: Malos ejemplos → malas salidas. El diseño de los ejemplos es la palanca de calidad central.

Sources: