GEO técnico
Los crawlers de IA no ejecutan JavaScript: por qué el renderizado en el servidor es la precondición de GEO | Suparanku
Los principales crawlers de IA — GPTBot, ClaudeBot y similares — no ejecutan JavaScript: el análisis de Vercel de inicios de 2025 (500 M+ de peticiones de GPTBot) no halló ejecución de JS. Lo que solo aparece tras renderizar en el cliente es invisible para la IA; el HTML del servidor es la precondición técnica de GEO.
Lo que sabemos con certeza
Vercel, junto con MERJ, analizó el tráfico de crawlers de IA en su red. A principios de 2025, solo GPTBot generaba más de quinientos millones de peticiones al mes, y la conclusión fue inequívoca: cero rastros de ejecución de JavaScript. GPTBot a veces descarga archivos JS (en torno al 11,5% de las peticiones), pero nunca los ejecuta. ClaudeBot y PerplexityBot se comportan igual.
Las citas de ChatGPT se apoyan en los bots de recuperación OAI-SearchBot y ChatGPT-User, mientras que GPTBot es un rastreador de entrenamiento. Bloquear GPTBot solo afecta al entrenamiento del modelo; bloquear OAI-SearchBot elimina tu sitio de las respuestas de ChatGPT. Las reglas de permiso/bloqueo y las comprobaciones del CDN deben cubrir los bots de recuperación, no solo GPTBot.
Una página renderizada únicamente en el cliente con React o Vue es, para un crawler de IA, HTML casi vacío. Si la descripción de tu producto y tus precios solo aparecen tras la hidratación, no alimentan ni el entrenamiento ni la generación de respuestas.
Comprueba tu sitio en tres minutos
- Desactiva JavaScript en las herramientas de desarrollo del navegador y recarga las páginas clave (producto, precios, empresa). Si el contenido es visible, tienes renderizado en el servidor.
- O haz clic derecho → «Ver código fuente de la página» y confirma que el texto principal existe en el HTML fuente. Un
<div id="root"></div>vacío es la señal de alarma. - Revisa también la configuración de tu CDN/WAF. Aunque robots.txt permita los bots de IA, algunos CDN los bloquean por defecto: una causa oculta frecuente — un análisis de Otterly de más de un millón de citas de IA encontró que el 73% de los sitios tienen barreras técnicas que bloquean los crawlers de IA.
Tus opciones
- Generación estática (SSG) — la primera opción para sitios de contenido: el HTML queda completo en el build, lo que gana en crawlers, velocidad y operación. Este sitio funciona así.
- Renderizado en el servidor (SSR) — para páginas que necesitan datos en tiempo real; el servidor devuelve HTML en cada petición.
- Aísla la interactividad — en lugar de una SPA completa, ejecuta en el cliente solo los widgets que lo necesitan (arquitectura de islas), de modo que el texto principal permanezca siempre en HTML estático.
La búsqueda clásica de Google sí puede renderizar JavaScript, pero el propio Google señala la rastreabilidad y la indexabilidad como precondiciones también para sus funciones de IA. Desde diciembre de 2025, sin embargo, Google excluye por completo de su pipeline de renderizado las páginas que no devuelven 200 (redirecciones y errores): el JS del lado del cliente en esas páginas es invisible incluso para Google. El renderizado en el servidor es la opción segura en todas las plataformas.
En resumen
La mayoría de los consejos de GEO se centran en qué escribir. Antes de eso hay una puerta técnica: ¿puede la IA ver siquiera lo que escribiste? Texto principal visible con JavaScript desactivado y un CDN que no bloquee en silencio los bots de IA: verificar estas dos cosas es el punto de partida de cualquier esfuerzo de GEO.
Términos relacionados: Crawler de IA, RAG, GEO