Janela de Contexto
Uma janela de contexto é o número máximo de tokens de entrada e saída que um LLM consegue processar em uma única requisição. Ela contém o prompt do usuário, o system prompt, a conversa anterior, os documentos recuperados por RAG e a resposta gerada - tudo de uma vez.
Uma janela de contexto é o número máximo de tokens de entrada e saída que um LLM consegue processar em uma única requisição. Ela contém o prompt do usuário, o system prompt, a conversa anterior, os documentos recuperados por RAG e a resposta gerada - tudo de uma vez.
Por que isso importa
A janela de contexto é a "memória de curto prazo" do LLM. Ela determina quantas páginas web um mecanismo de busca por IA consegue considerar ao responder a uma consulta e quão longo é o documento que ele consegue sumarizar. Em 2023, a norma eram 4K a 8K tokens; em 2026, mais de 1M de tokens é o padrão - o que muda de forma fundamental a amplitude e a profundidade das fontes que os LLMs utilizam. Para o GEO, isso significa que a busca por IA agora compara muitas páginas concorrentes de uma só vez e decide qual delas citar, tornando a estrutura do documento e a qualidade das seções o fator decisivo.
Janelas de contexto por modelo (2026)
| Modelo | Janela de Contexto |
|---|---|
| Claude Opus 4.6 | 1M tokens |
| Gemini 3 | 1M-2M tokens |
| GPT-5 | 400K tokens |
| Llama 4 | 128K-1M tokens |
1M de tokens equivale a cerca de 750K palavras em inglês - mais ou menos um livro de 400 a 500 páginas.
Tokens, não palavras
As janelas de contexto são medidas em tokens, não em palavras. O inglês tem em média ~1,3 token por palavra, mas idiomas como o coreano ou o japonês usam ~1,5 a 2 tokens por caractere, o que significa que conteúdo fora do inglês consome bem mais do orçamento para o mesmo comprimento de página.
Implicações para GEO
Documentos inteiros são processados: os LLMs antes viam apenas os principais trechos; agora leem páginas inteiras e escolhem a melhor seção para citar. A clareza estrutural ao longo de todo o documento importa.
Comparação direta com concorrentes: janelas de contexto grandes permitem aos modelos comparar de uma só vez muitas páginas concorrentes para a mesma consulta. Vencer não é ser "bom" - é ser estruturalmente mais fácil de citar do que as alternativas.
Front-loading importa mais: os LLMs pesam mais os tokens iniciais. Coloque a definição central e a resposta logo no topo do documento.
"Lost in the middle": mesmo modelos de contexto grande degradam diante de informação enterrada no meio do documento. O conteúdo crítico pertence ao início ou ao fim, não ao meio.
Fontes: