Geo Scoring expliqué : la méthodologie 13 critères derrière les audits de citation IA modernes
Le geo scoring mesure la citabilité d'un site par les IA génératives, exprimée sous forme d'une note unique sur 100 construite à partir d'un panier pondéré de critères techniques, éditoriaux et off-page. Il joue pour la recherche IA le rôle que l'autorité de domaine ou PageSpeed jouent pour le SEO classique : un indicateur avancé que vous pouvez suivre, benchmarker et activer. Ce guide détaille la méthodologie 13 critères derrière un geo score moderne, les poids empiriques et les études dont ils sont issus.
Pourquoi le geo scoring existe : le problème créé par les LLM
Le scoring SEO classique (autorité de domaine, PageRank, Lighthouse) a été conçu pour un parcours unique : taper une requête, voir dix liens bleus, en cliquer un. Ce modèle se fissure. D'après Sistrix (avril 2026), 58 % des requêtes Google en France déclenchent une AI Overview qui synthétise une réponse avant tout clic. ChatGPT Search annonce 600 M d'utilisateurs mensuels (OpenAI, fin 2025), Perplexity dépasse 30 M. Pour une part croissante des requêtes, le premier point de contact avec une marque est un paragraphe d'IA qui vous cite, ou non.
Les moteurs IA choisissent leurs sources avec des règles qui ne recoupent que partiellement le SEO. Vercel + MERJ ont confirmé sur 500 M+ fetches que GPTBot, ClaudeBot et PerplexityBot n'exécutent jamais le JavaScript : une SPA React optimisée SEO peut avoir 90 sur Lighthouse et rester invisible pour ChatGPT. Inversement, une page statique avec de fortes mentions sur Wikipedia et Reddit peut être citée malgré un Lighthouse médiocre. Deux jeux différents. Le geo scoring comble l'écart avec des signaux que les études empiriques relient aux citations IA.
Les 13 critères pondérés du geo scoring
La méthodologie ci-dessous a été recalibrée en mai 2026 après que l'étude contrôlée Ahrefs sur le JSON-LD a forcé une révision à la baisse des poids des données structurées et que l'étude Ahrefs sur 75 000 marques a élevé les mentions de marque off-page au rang de signal primaire. Total : 100 points.
1. Rendu serveur — 15 points
Le critère le plus lourd. GPTBot, ClaudeBot, PerplexityBot et Google-Extended n'exécutent pas le JavaScript — Vercel + MERJ ont vérifié zéro exécution JS sur 500 M+ fetches. Une SPA React, Vue ou Angular sans SSR apparaît comme un <div id="root"></div> vide. Seul Googlebot fait un rendu à deux phases. D'où le poids dominant.
2. Structure « réponse d'abord » — 13 points
ALM Corp 2025 (1,2 M de réponses ChatGPT, 18 000 citations) : 44,2 % des citations viennent du premier tiers de la page. Le papier Princeton / Allen Institute / Georgia Tech (« GEO: Generative Engine Optimization », KDD 2024) a testé neuf stratégies sur 10 000 requêtes et rapporté +27,8 % de visibilité générative pour « Quotation Addition ». Un H2 formulé en question suivi d'une réponse autonome de 40-75 mots est le meilleur prédicteur éditorial de citation IA.
3. Mentions de marque off-page — 11 points
Ahrefs (75 000 marques, décembre 2025) : corrélation de 0,664 entre mentions de marque web et visibilité ChatGPT — environ trois fois plus prédictive que les backlinks (0,218). Mentions YouTube : 0,737. Désormais traité comme signal primaire. Le scoring interroge la connaissance paramétrique de Claude plutôt que de parser le HTML.
4. Fraîcheur du contenu — 10 points
Ahrefs (17 M de citations sur sept plateformes IA) : les pages citées sont 25,7 % plus fraîches que la moyenne organique Google. Seuil pratique : un dateModified sous 12 mois est favorisé ; au-delà de 36 mois, pénalité. Le score récompense une date de mise à jour récente dans le JSON-LD et la signature visible.
5. Richesse en entités et chiffres — 9 points
KDD 2024 : +25,9 % de visibilité générative pour « Statistics Addition » — chiffres sourcés ajoutés au contenu. GenOptima 2025 : les pages avec 3+ statistiques pour 300 mots sont citées 2,1× plus souvent. Le score compte chiffres, pourcentages, montants, dates, listes et tableaux dans le HTML rendu.
6. Présence sur les sources favorites des IA — 9 points
Semrush (150 000 citations LLM, juin 2025) a identifié trois sources dominantes : Reddit (40,1 %), Wikipedia (26,3 %) et YouTube (23,5 %). L'étude Profound sur 680 M de citations a placé Wikipedia dans le top-10 pour 47,9 % des réponses ChatGPT. Le scoring sonde la présence sur ces trois plateformes via la connaissance de Claude.
7. Accès des crawlers IA — 8 points
Bloqueur binaire. Le score parse /robots.txt contre sept crawlers : GPTBot, OAI-SearchBot, ChatGPT-User, Google-Extended, ClaudeBot, PerplexityBot et CCBot. Un seul bot bloqué rend le site invisible pour cette IA. Beaucoup de sites héritent silencieusement de Disallow: / depuis des templates CMS ou plugins de sécurité.
8. Signaux E-E-A-T d'auteur — 7 points
Contently 2026 : +40 % de taux de citation pour les pages avec bio visible. Wellows : 96 % des citations AI Overviews viennent de sources avec signaux E-E-A-T explicites. Le score cherche <meta name="author">, le JSON-LD Person, les signatures et les credentials dans le texte visible.
9. HTML sémantique — 5 points
Un seul <h1>, une hiérarchie de titres cohérente, listes et tableaux structurés, contenu dans <main>. Utile mais partiellement redondant avec le scoring « réponse d'abord » — poids ramené de 10 à 5 lors du recalibrage de mai 2026.
10. Données structurées / JSON-LD — 4 points
La plus grosse baisse de mai 2026, de 14 à 4. L'étude contrôlée Ahrefs (mars 2026, 1 885 pages) n'a trouvé aucune amélioration statistiquement significative du schema markup sur ChatGPT ou AI Mode, et un léger effet négatif (-12 citations/jour) sur les AI Overviews. La corrélation 3× historique était un biais de sélection. Le JSON-LD est conservé car il sert encore les rich features de Google.
11. Métadonnées SEO — 4 points
Title (30-65 caractères), meta description (70-160), canonical, OpenGraph, Twitter Card. Important pour Google et le partage social, mais les LLM lisent surtout le corps. Faible poids par design.
12. Données originales first-party — 4 points
Yext (6,8 M de citations) : 86 % des citations IA proviennent de sources gérées par la marque. Am I Cited 2026 : +30 à +40 % de visibilité pour les pages qui publient de la recherche originale. Le score mesure la densité de chiffres propriétaires (taille de base clients, résultats mesurés, cas nommés) plutôt que des stats sectorielles recyclées.
13. Fichier llms.txt — 1 point
Poids symbolique. Gary Illyes (Google, 24 juillet 2025) a déclaré publiquement que Google ne supporte pas llms.txt. Anthropic et Perplexity le récupèrent à la marge. Présent = micro-bonus, absent = pas de réelle pénalité.
Comment chaque critère est mesuré
Tous les critères on-page sont mesurés contre le HTML brut renvoyé par une seule requête GET, sans exécution de JavaScript. C'est exactement ce que voient GPTBot, ClaudeBot et PerplexityBot. Mesurer le DOM rendu gonflerait les scores par rapport à ce que les LLM ingèrent réellement.
Le rendu serveur renvoie 1.0 si le contenu principal est dans le HTML brut, proche de 0.0 si seule une coquille SPA vide est renvoyée. Le scoring « réponse d'abord » localise le premier paragraphe après le H1 et récompense une réponse autonome de 40-75 mots sans habillage marketing. Les mentions de marque off-page interrogent Claude sur l'empreinte de la marque sur Wikipedia, Reddit, YouTube et la presse — le seul critère qui ne parse pas l'URL.
La fraîcheur lit <meta property="article:modified_time">, dateModified dans le JSON-LD Article, et tout pattern visible « Mis à jour le ». La richesse en entités compte tokens numériques, pourcentages, dates ISO et items de liste normalisés par mot. L'accès crawler parse /robots.txt contre les sept crawlers. Le scoring E-E-A-T cherche <meta name="author">, le JSON-LD Person et les signatures près du H1. Le scoring JSON-LD valide le @type contre une allowlist et récompense la complétude des champs requis. Les données originales sont repérées par une heuristique distinguant les chiffres précédés de marqueurs first-person (« nos clients », « nous avons mesuré ») des chiffres suivis de citations externes. Détails complets sur scoregeo.ai/methodology.
Geo scoring vs scoring SEO : 5 différences fondamentales
Les deux produisent une note sur 100, mais mesurent des choses différentes et reposent sur des signaux différents. Les 5 différences ci-dessous expliquent pourquoi un bon score SEO n'implique pas un bon geo score.
Différence 1 : exécution JavaScript. Les outils SEO rendent le JavaScript (Googlebot fait du rendu à deux phases depuis 2019, Lighthouse tourne en Chrome headless). Le geo scoring ne le fait pas délibérément, car GPTBot, ClaudeBot et PerplexityBot ne le font pas. Un site noté 92 sur Lighthouse peut tomber à 35 sur un audit geo si c'est une SPA sans SSR.
Différence 2 : pondération des données structurées. Le scoring SEO récompense généreusement le JSON-LD pour les rich snippets. Le geo scoring, post-étude Ahrefs de mars 2026, le pondère à 4 points. Les deux systèmes ont divergé sur ce critère début 2026.
Différence 3 : format éditorial. Le SEO mesure à peine le format d'intro ; Google tolère le storytelling. Le geo scoring pondère le « réponse d'abord » à 13 points parce que les LLM préfèrent les pages qui répondent dans les 75 premiers mots. Le plus gros écart.
Différence 4 : signaux off-page. Le scoring SEO repose sur les backlinks et l'autorité de domaine (Ahrefs DR, Moz DA). Le geo scoring repose sur les mentions de marque sur Wikipedia, Reddit, YouTube et la presse — trois fois plus prédictives selon l'étude Ahrefs sur 75 000 marques.
Différence 5 : KPI primaire. Le scoring SEO suit la position en SERP et les clics organiques. Le geo scoring suit le taux de citation IA, mesuré en échantillonnant ChatGPT, Claude, Perplexity, Gemini et les AI Overviews. Dashboards différents (Search Console vs ScoreGeo).
Calculer votre Geo Score
Chacun des 13 critères renvoie une note normalisée entre 0 et 1, multipliée par son poids ; la somme donne la note globale sur 100. Sévérités : ≥ 0,85 réussi, ≥ 0,40 à améliorer, < 0,40 échec. Tranches globales : 80+ Excellent, 60-79 Bon, 40-59 Moyen, < 40 À risque.
Deux remarques. La décomposition par critère compte plus que l'agrégat — deux sites à 62 peuvent avoir des plans d'action opposés. Les critères ne sont pas indépendants : corriger le rendu serveur débloque souvent des gains sur le HTML sémantique et le « réponse d'abord ».
ScoreGeo exécute cette méthodologie sur n'importe quelle URL en environ 6 secondes, gratuitement. L'analyse renvoie la note globale, les 13 sous-scores, les sévérités et les 3 corrections prioritaires. La méthodologie complète est publique sur scoregeo.ai/methodology — pas de boîte noire. Pour le contexte sur l'intérêt du GEO au-delà du score, le guide qu'est-ce que le GEO couvre les mécaniques sous-jacentes.
Questions fréquentes
Qu'est-ce que le geo scoring ?
Le geo scoring mesure dans quelle mesure un site est positionné pour être cité par les IA génératives (ChatGPT, Claude, Perplexity, Gemini, AI Overviews) et exprime cette mesure sous forme d'une note unique, typiquement sur 100. Le score agrège des critères techniques, éditoriaux et off-page pondérés, calibrés sur des études empiriques de citation IA.
Qu'est-ce qu'un technical geo score ?
Le sous-ensemble d'un audit geo qui se concentre sur les critères de lisibilité machine : rendu serveur, HTML sémantique, JSON-LD, accès robots.txt pour les crawlers IA, llms.txt et métadonnées. Dans la méthodologie ScoreGeo, le bloc technique représente environ 35 des 100 points. Corrigeable en jours à semaines puisque le travail est purement on-site.
Comment se calcule un geo score ?
Chacun des 13 critères renvoie un sous-score normalisé entre 0 et 1, multiplié par son poids ; la somme donne la note globale sur 100. Les poids sont calibrés sur des études empiriques (Ahrefs 75k marques, Princeton KDD 2024, Vercel + MERJ 500M fetches, Semrush 150k citations). Détail public sur scoregeo.ai/methodology.
Existe-t-il un calculateur de geo score gratuit ?
Oui. ScoreGeo exécute l'audit 13 critères sur n'importe quelle URL publique gratuitement et renvoie la note globale, la décomposition par critère et les corrections prioritaires en environ 6 secondes. Aucun compte requis.
Quel est un bon geo score en 2026 ?
80+ Excellent, 60-79 Bon, 40-59 Moyen, < 40 À risque. Le contexte compte : un 68 dans une niche B2B SaaS compétitive vaut souvent mieux qu'un 78 dans une verticale peu concurrentielle. Au-delà de 80, le coût marginal grimpe fortement — la plupart des sites gagnent à plafonner entre 80 et 85.
Pourquoi le geo scoring pondère-t-il si peu le JSON-LD maintenant ?
L'étude contrôlée Ahrefs (mars 2026, 1 885 pages) n'a trouvé aucune amélioration statistiquement significative du schema markup sur ChatGPT ou AI Mode, et un léger effet négatif sur les AI Overviews. La corrélation historique 3× était un biais de sélection. La méthodologie a été recalibrée de 14 à 4 points en mai 2026.