GEO técnico
Crawlers de IA não executam JavaScript — por que a renderização no servidor é a precondição do GEO | Suparanku
Os principais crawlers de IA — GPTBot, ClaudeBot e similares — não executam JavaScript. No início de 2025, a Vercel analisou mais de meio bilhão de requisições do GPTBot: zero execução de JS. Conteúdo que só aparece após renderização no cliente é invisível para a IA — o HTML gerado no servidor é a precondição do GEO.
O que sabemos de fato
A Vercel, junto com a MERJ, analisou o tráfego de crawlers de IA em sua rede. No início de 2025, só o GPTBot gerava mais de meio bilhão de requisições por mês, e a conclusão foi inequívoca: zero traços de execução de JavaScript. O GPTBot às vezes baixa arquivos JS (cerca de 11,5% das requisições), mas nunca os executa. ClaudeBot e PerplexityBot se comportam da mesma forma.
As citações do ChatGPT são alimentadas pelos bots de recuperação OAI-SearchBot e ChatGPT-User, enquanto o GPTBot é um coletor de treinamento. Bloquear o GPTBot afeta apenas o treinamento do modelo; bloquear o OAI-SearchBot remove seu site das respostas do ChatGPT. As regras de permissão/bloqueio e as verificações de CDN precisam cobrir os bots de recuperação, não só o GPTBot.
Uma página renderizada apenas no cliente, em React ou Vue, é, para um crawler de IA, um HTML praticamente vazio. Se a descrição do seu produto e os preços só aparecem depois da hidratação, eles não alimentam nem o treinamento nem a geração de respostas.
Verifique seu site em três minutos
- Desative o JavaScript nas ferramentas de desenvolvedor do navegador e recarregue as páginas principais (produto, preços, empresa). Se o conteúdo estiver visível, você tem renderização no servidor.
- Ou clique com o botão direito → “Exibir código-fonte da página” e confirme que o texto do corpo existe no HTML de origem. Um
<div id="root"></div>vazio é o sinal de alerta. - Verifique também as configurações da sua CDN/WAF. Mesmo com os bots de IA liberados no robots.txt, algumas CDNs os bloqueiam por padrão — uma causa oculta comum: uma análise da Otterly com mais de um milhão de citações de IA constatou que 73% dos sites têm barreiras técnicas bloqueando crawlers de IA.
Suas opções
- Geração estática (SSG) — primeira escolha para sites de conteúdo: o HTML fica completo no momento do build, o que ganha em crawlers, velocidade e operação. Este site funciona assim.
- Renderização no servidor (SSR) — para páginas que precisam de dados em tempo real; o servidor retorna o HTML a cada requisição.
- Isolar a interatividade — em vez de uma SPA completa, rode no cliente apenas os widgets que precisam disso (arquitetura de ilhas), para que o texto do corpo permaneça sempre no HTML estático.
A busca clássica do Google consegue renderizar JavaScript, mas o próprio Google lista rastreabilidade e indexabilidade como precondições também para seus recursos de IA. Desde dezembro de 2025, porém, o Google exclui completamente de seu pipeline de renderização as páginas não-200 (redirecionamentos e erros) — o JS no lado do cliente nessas páginas é invisível até para o Google. Renderização no servidor é a escolha segura em todas as plataformas.
Resumo
A maior parte dos conselhos de GEO foca no que escrever. Antes disso vem um portão técnico: a IA consegue sequer ver o que você escreveu? Texto do corpo visível com o JavaScript desligado e uma CDN que não bloqueia silenciosamente os bots de IA — verificar essas duas coisas é o ponto de partida de qualquer esforço de GEO.
Termos relacionados: Crawler de IA, RAG, GEO