Ventana de Contexto
Una ventana de contexto es el número máximo de tokens de entrada y de salida que un LLM puede procesar en una sola solicitud. Contiene el prompt del usuario, el system prompt, la conversación previa, los documentos recuperados por RAG y la respuesta generada, todo a la vez.
Una ventana de contexto es el número máximo de tokens de entrada y de salida que un LLM puede procesar en una sola solicitud. Contiene el prompt del usuario, el system prompt, la conversación previa, los documentos recuperados por RAG y la respuesta generada, todo a la vez.
Por qué importa
La ventana de contexto es la "memoria a corto plazo" del LLM. Determina cuántas páginas web puede considerar un buscador con IA al responder una consulta y qué tan largo es el documento que puede resumir. En 2023 la norma era de 4K a 8K tokens; en 2026, más de 1 millón de tokens es lo estándar, lo que cambia de manera fundamental la amplitud y la profundidad de las fuentes de las que se nutren los LLM. Para la GEO, esto significa que la búsqueda con IA ahora compara muchas páginas que compiten entre sí a la vez y decide cuál citar, lo que convierte la estructura del documento y la calidad de las secciones en el factor decisivo.
Ventanas de contexto por modelo (2026)
| Modelo | Ventana de contexto |
|---|---|
| Claude Opus 4.6 | 1M de tokens |
| Gemini 3 | 1M a 2M de tokens |
| GPT-5 | 400K tokens |
| Llama 4 | 128K a 1M de tokens |
1 millón de tokens equivale aproximadamente a 750K palabras en inglés, alrededor de un libro de 400 a 500 páginas.
Tokens, no palabras
Las ventanas de contexto se miden en tokens, no en palabras. El inglés promedia ~1,3 tokens por palabra, pero idiomas como el coreano o el japonés usan ~1,5 a 2 tokens por carácter, lo que significa que el contenido en otros idiomas consume una porción considerablemente mayor del presupuesto para la misma extensión de página.
Implicaciones para la GEO
Se procesan documentos completos: Antes los LLM veían solo los fragmentos superiores; ahora leen páginas enteras y eligen la mejor sección para citar. La claridad estructural de todo el documento importa.
Comparación directa con competidores: Las grandes ventanas de contexto permiten que los modelos comparen muchas páginas que compiten por la misma consulta a la vez. Ganar no se trata de ser "bueno"; se trata de ser estructuralmente más fácil de citar que las alternativas.
El front-loading importa más: Los LLM dan más peso a los tokens iniciales. Coloca la definición central y la respuesta en la parte superior del documento.
"Perdido en el medio": Incluso los modelos de gran contexto se degradan con la información enterrada en el medio del documento. El contenido crítico va cerca del inicio o del final, no del medio.
Sources: