GEO

Janela de Contexto

Uma janela de contexto é o número máximo de tokens de entrada e saída que um LLM consegue processar em uma única requisição. Ela contém o prompt do usuário, o system prompt, a conversa anterior, os documentos recuperados por RAG e a resposta gerada - tudo de uma vez.

Uma janela de contexto é o número máximo de tokens de entrada e saída que um LLM consegue processar em uma única requisição. Ela contém o prompt do usuário, o system prompt, a conversa anterior, os documentos recuperados por RAG e a resposta gerada - tudo de uma vez.

Por que isso importa

A janela de contexto é a "memória de curto prazo" do LLM. Ela determina quantas páginas web um mecanismo de busca por IA consegue considerar ao responder a uma consulta e quão longo é o documento que ele consegue sumarizar. Em 2023, a norma eram 4K a 8K tokens; em 2026, mais de 1M de tokens é o padrão - o que muda de forma fundamental a amplitude e a profundidade das fontes que os LLMs utilizam. Para o GEO, isso significa que a busca por IA agora compara muitas páginas concorrentes de uma só vez e decide qual delas citar, tornando a estrutura do documento e a qualidade das seções o fator decisivo.

Janelas de contexto por modelo (2026)

ModeloJanela de Contexto
Claude Opus 4.61M tokens
Gemini 31M-2M tokens
GPT-5400K tokens
Llama 4128K-1M tokens

1M de tokens equivale a cerca de 750K palavras em inglês - mais ou menos um livro de 400 a 500 páginas.

Tokens, não palavras

As janelas de contexto são medidas em tokens, não em palavras. O inglês tem em média ~1,3 token por palavra, mas idiomas como o coreano ou o japonês usam ~1,5 a 2 tokens por caractere, o que significa que conteúdo fora do inglês consome bem mais do orçamento para o mesmo comprimento de página.

Implicações para GEO

Documentos inteiros são processados: os LLMs antes viam apenas os principais trechos; agora leem páginas inteiras e escolhem a melhor seção para citar. A clareza estrutural ao longo de todo o documento importa.

Comparação direta com concorrentes: janelas de contexto grandes permitem aos modelos comparar de uma só vez muitas páginas concorrentes para a mesma consulta. Vencer não é ser "bom" - é ser estruturalmente mais fácil de citar do que as alternativas.

Front-loading importa mais: os LLMs pesam mais os tokens iniciais. Coloque a definição central e a resposta logo no topo do documento.

"Lost in the middle": mesmo modelos de contexto grande degradam diante de informação enterrada no meio do documento. O conteúdo crítico pertence ao início ou ao fim, não ao meio.

Fontes: