Ingeniería de Contexto
La ingeniería de contexto es la práctica de diseñar deliberadamente qué información, en qué orden y en qué formato ve un LLM cuando genera una respuesta. Abarca la ingeniería de prompts, que pule un único prompt, y se extiende a todo lo que entra en la ventana de contexto: system prompts, documentos recuperados, historial de conversación, metadatos del usuario, esquemas de herramientas y más. Simon Willison, Tobi Lütke y Andrej Karpathy comenzaron a usar el término públicamente en 2025, y para 2026 se ha convertido en vocabulario estándar en la ingeniería de productos de LLM.
La ingeniería de contexto es la práctica de diseñar deliberadamente qué información, en qué orden y en qué formato ve un LLM cuando genera una respuesta. Abarca la ingeniería de prompts, que pule un único prompt, y se extiende a todo lo que entra en la ventana de contexto: system prompts, documentos recuperados, historial de conversación, metadatos del usuario, esquemas de herramientas y más. Simon Willison, Tobi Lütke y Andrej Karpathy comenzaron a usar el término públicamente en 2025, y para 2026 se ha convertido en vocabulario estándar en la ingeniería de productos de LLM.
Por qué importa
La mayoría de los fallos de los productos de LLM en producción provienen de "le dimos al modelo el contexto equivocado", no de "el modelo es malo". Incluso con ventanas de contexto de 1 millón de tokens, volcar información al azar perjudica el rendimiento, el bien documentado efecto "perdido en el medio". La ingeniería de contexto trata la entrada compuesta (RAG, memoria, herramientas, historial) como una variable de diseño, y el mismo modelo puede rendir entre 2 y 10 veces mejor con una mejor construcción del contexto.
Qué compone el contexto
System prompt: Instrucciones fijas: rol, restricciones, tono, objetivos.
Prompt del usuario: La entrada del usuario para este turno.
Historial de conversación: Los turnos anteriores.
Resultados de RAG: Documentos y chunks relevantes de una base de datos vectorial.
Definiciones de herramientas: Nombres, descripciones y esquemas de las funciones invocables.
Resultados de las llamadas a herramientas: Datos devueltos por invocaciones anteriores de herramientas.
Metadatos del usuario: Idioma, zona horaria, plan de suscripción, historial de comportamiento.
Constitución / guardrails: Reglas de seguridad, temas prohibidos, filtros de salida.
Todo esto se fusiona en una única ventana de contexto que va al LLM.
Ingeniería de contexto vs ingeniería de prompts
| Aspecto | Ingeniería de prompts | Ingeniería de contexto |
|---|---|---|
| Unidad | Una sola oración de prompt | Toda la ventana de contexto |
| Preocupación | "¿Cómo pregunto?" | "¿Qué debo mostrar?" |
| Nivel | Táctico (a nivel de oración) | Sistémico (a nivel de pipeline) |
| Ejemplo | Añadir "piensa paso a paso" | Decidir el número de chunks de RAG, su orden y su resumen |
La ingeniería de prompts es el oficio de escribir buenas oraciones; la ingeniería de contexto es el oficio de diseñar toda la estructura de entrada en la que viven esas oraciones.
Principios fundamentales
Incluye solo lo necesario: Un contexto más largo significa más "perdido en el medio" y un mayor costo. Recorta sin piedad la información irrelevante.
Ordena de forma deliberada: Los LLM dan más peso al inicio y al final. Coloca las instrucciones y los datos más importantes en los extremos.
Etiquetado estructurado: Envuelve los documentos externos en <source>…</source> y los ejemplos en <example>…</example>, para que el modelo conozca el rol de cada parte.
Selección dinámica: Distintos tipos de solicitud merecen distintas listas de herramientas, resultados de RAG y system prompts. Un enfoque único para todo desperdicia tokens.
Resume y comprime: Resume los historiales largos para ahorrar tokens. Funciones como los artifacts de Claude son un ejemplo canónico.
Gestiona los bucles de agente: Para el razonamiento de varios pasos, limpia y reconstruye el contexto entre pasos.
Desafíos prácticos
Presupuesto de tokens: Las ventanas de contexto no son gratuitas. Llenar 1 millón de tokens dispara el costo y la latencia.
Ranking de relevancia: Decide cuántos chunks de RAG extraer y cuánto reordenar.
Estrategia de memoria: Memoria a largo plazo en una base de datos vectorial, memoria a corto plazo mediante resumen.
Depuración: Cuando la calidad de la salida cae, encuentra qué parte del contexto tiene la culpa. El registro y la reproducibilidad son esenciales.
Implicaciones para la GEO
Los buscadores con IA son, en sí mismos, pipelines de ingeniería de contexto. El contenido estructurado para "encajar bien en el contexto" se cita más. En concreto: ① cada sección debe poder resumirse de forma independiente, ② la primera oración debe contener la respuesta central, ③ los metadatos y las fuentes deben ser explícitos. Eso es "escribir de forma apta para la ingeniería de contexto" para los bloggers.
Sources: