GEO technique
Les crawlers IA n'exécutent pas JavaScript — pourquoi le rendu côté serveur est le prérequis de la GEO | Suparanku
Les grands crawlers IA — GPTBot, ClaudeBot et autres — n'exécutent pas JavaScript : début 2025, Vercel n'a trouvé aucune exécution JS sur plus d'un demi-milliard de requêtes GPTBot. Un contenu visible seulement après le rendu côté client est invisible pour l'IA ; le HTML rendu côté serveur est le prérequis de la GEO.
Ce que l’on sait réellement
Vercel, avec MERJ, a analysé le trafic des crawlers IA sur son réseau. Début 2025, GPTBot générait à lui seul plus d’un demi-milliard de requêtes par mois, et la conclusion est sans ambiguïté : aucune trace d’exécution de JavaScript. GPTBot télécharge parfois des fichiers JS (environ 11,5 % des requêtes) mais ne les exécute jamais. ClaudeBot et PerplexityBot se comportent de la même manière.
Les citations de ChatGPT reposent sur les bots de récupération OAI-SearchBot et ChatGPT-User, tandis que GPTBot est un collecteur d’entraînement. Bloquer GPTBot n’affecte que l’entraînement du modèle ; bloquer OAI-SearchBot retire votre site des réponses de ChatGPT. Les règles d’autorisation/blocage et les vérifications CDN doivent couvrir les bots de récupération, pas seulement GPTBot.
Une page rendue uniquement côté client en React ou Vue n’est, pour un crawler IA, qu’un HTML presque vide. Si votre description produit et vos tarifs n’apparaissent qu’après l’hydratation, ils n’alimentent ni l’entraînement ni la génération de réponses.
Vérifiez votre site en trois minutes
- Désactivez JavaScript dans les outils de développement de votre navigateur et rechargez les pages clés (produit, tarifs, société). Si le contenu est visible, votre rendu est côté serveur.
- Ou faites un clic droit → « Afficher le code source de la page » et confirmez que le corps du texte figure dans le HTML source. Un simple
<div id="root"></div>est le signal d’alerte. - Vérifiez aussi les réglages de votre CDN/WAF. Même avec des bots IA autorisés dans robots.txt, certains CDN les bloquent par défaut — une cause cachée fréquente : une analyse Otterly de plus d’un million de citations IA a révélé que 73 % des sites présentent des barrières techniques bloquant les crawlers IA.
Vos options
- Génération statique (SSG) — premier choix pour les sites de contenu : le HTML est complet au moment du build, ce qui gagne sur les crawlers, la vitesse et l’exploitation. Ce site fonctionne ainsi.
- Rendu côté serveur (SSR) — pour les pages qui ont besoin de données en temps réel ; le serveur renvoie le HTML à chaque requête.
- Isoler l’interactivité — plutôt qu’une SPA complète, n’exécutez côté client que les widgets qui en ont besoin (architecture en îlots), afin que le corps du texte reste toujours dans le HTML statique.
La recherche classique de Google sait rendre le JavaScript, mais Google lui-même cite la crawlabilité et l’indexabilité comme préalables, y compris pour ses fonctionnalités IA. Depuis décembre 2025, toutefois, Google exclut entièrement de son pipeline de rendu les pages non-200 (redirections et erreurs) — le JS côté client sur ces pages est invisible même pour Google. Le rendu côté serveur est le choix sûr sur toutes les plateformes.
En résumé
La plupart des conseils GEO portent sur quoi écrire. Mais il y a d’abord un verrou technique : l’IA peut-elle seulement voir ce que vous avez écrit ? Un corps de texte visible avec JavaScript désactivé, et un CDN qui ne bloque pas silencieusement les bots IA — vérifier ces deux points est le point de départ de tout travail GEO.
Termes associés : Crawler IA, RAG, GEO