GEO tecnica
I crawler AI non eseguono JavaScript — perché il server rendering è la precondizione della GEO | Suparanku
I principali crawler AI — GPTBot, ClaudeBot e altri — non eseguono JavaScript. L'analisi di Vercel di inizio 2025 su oltre mezzo miliardo di richieste GPTBot non ha trovato esecuzione JS. Il contenuto che appare solo dopo il rendering client-side è invisibile all'AI: l'HTML server-rendered è la precondizione della GEO.
Cosa sappiamo davvero
Vercel, insieme a MERJ, ha analizzato il traffico dei crawler AI sulla propria rete. A inizio 2025, il solo GPTBot generava oltre mezzo miliardo di richieste al mese, e la conclusione è stata inequivocabile: zero tracce di esecuzione JavaScript. GPTBot a volte scarica file JS (circa l’11,5% delle richieste) ma non li esegue mai. ClaudeBot e PerplexityBot si comportano allo stesso modo.
Le citazioni di ChatGPT si basano sui bot di retrieval OAI-SearchBot e ChatGPT-User, mentre GPTBot è uno scraper di training. Bloccare GPTBot incide solo sull’addestramento del modello; bloccare OAI-SearchBot rimuove il tuo sito dalle risposte di ChatGPT. Le regole allow/deny e i controlli sulla CDN devono coprire i bot di retrieval, non solo GPTBot.
Una pagina renderizzata solo lato client in React o Vue è, per un crawler AI, HTML in gran parte vuoto. Se la descrizione del prodotto e i prezzi compaiono solo dopo l’hydration, non alimentano né il training né la generazione delle risposte.
Verifica il tuo sito in tre minuti
- Disattiva JavaScript nei dev tools del browser e ricarica le pagine chiave (prodotto, prezzi, azienda). Se il contenuto è visibile, sei server-rendered.
- Oppure clic destro → «Visualizza sorgente pagina» e conferma che il testo del corpo esista nell’HTML sorgente. Un nudo
<div id="root"></div>è il segnale d’allarme. - Controlla anche le impostazioni di CDN/WAF. Anche con i bot AI permessi nel robots.txt, alcune CDN li bloccano di default — una causa nascosta frequente: un’analisi di Otterly su oltre un milione di citazioni AI ha rilevato che il 73% dei siti presenta barriere tecniche che bloccano i crawler AI.
Le tue opzioni
- Generazione statica (SSG) — prima scelta per i siti di contenuto: l’HTML è completo al momento della build, il che vince su crawler, velocità e operazioni. Questo sito funziona così.
- Server-side rendering (SSR) — per le pagine che richiedono dati in tempo reale; il server restituisce HTML a ogni richiesta.
- Isolare l’interattività — invece di una SPA completa, eseguire sul client solo i widget che ne hanno bisogno (islands architecture), così il testo del corpo resta sempre nell’HTML statico.
La ricerca classica di Google sa renderizzare JavaScript, ma Google stessa elenca crawlability e indicizzabilità come precondizioni anche per le sue funzionalità AI. Da dicembre 2025, però, Google esclude completamente dalla sua pipeline di rendering le pagine non-200 (redirect ed errori) — il JS client-side su quelle pagine è invisibile persino a Google. Il server rendering è la scelta sicura su ogni piattaforma.
In sintesi
La maggior parte dei consigli GEO si concentra su cosa scrivere. Prima viene però un cancello tecnico: l’AI può vedere quello che hai scritto? Testo del corpo visibile con JavaScript disattivato, e una CDN che non blocca silenziosamente i bot AI — verificare queste due cose è il punto di partenza di ogni iniziativa GEO.
Termini correlati: AI crawler, RAG, GEO