Méthodologie

ScoreGeo analyse votre URL côté serveur : on récupère votre HTML brut, votre /robots.txt et votre /llms.txt, puis on évalue 9 critères pondérés à 100 points au total.

Les 9 critères et leur poids

20
Rendu serveur
On récupère le HTML brut sans exécuter le JavaScript. On compte les mots visibles : un SPA dont le contenu n'apparaît qu'après hydratation est quasi invisible pour les LLM.
20
Données structurées (JSON-LD)
Extraction de tous les blocs <script type="application/ld+json"> (y compris @graph récursif). Bonus pour les types très exploités par les IA : FAQPage, HowTo, LocalBusiness, Product.
10
Structure « réponse d'abord »
On cherche le premier paragraphe significatif dans <main>/<article>/après le H1. Sweet spot : 15-80 mots, ≤ 600 caractères. C'est le format que les LLM extraient en citation directe.
10
Fraîcheur du contenu
dateModified/datePublished du JSON-LD + balises <time datetime>. Une page de moins de 6 mois est valorisée, > 36 mois pénalisée.
10
HTML sémantique
Un seul <h1>, hiérarchie de titres cohérente (pas de saut h2→h4), <main> unique, présence de <article> ou <section>.
10
Métadonnées SEO
title (30-65 car.), meta description (70-160 car.), canonical, OpenGraph (title/description/image/type), Twitter Card. Ces signaux servent aussi aux LLM pour résumer.
10
Accès des crawlers IA
Parsing de /robots.txt. On vérifie l'accès des 6 crawlers IA majeurs : GPTBot, ChatGPT-User, Google-Extended (Gemini & AI Overviews), ClaudeBot, PerplexityBot, CCBot.
5
Richesse en entités
Compteur de chiffres, listes, tableaux, definition-lists, questions FAQ-style (« Comment… ? », « Pourquoi… ? »). Plus le contenu est dense en entités, plus il est citable.
5
Fichier llms.txt
Présence d'un fichier /llms.txt à la racine (standard émergent proposé par Jeremy Howard) qui pointe les LLM vers vos contenus prioritaires en Markdown.

Calcul du score

Chaque critère renvoie une note normalisée entre 0 et 1, multipliée par son poids. La somme donne le score global sur 100. Une sévérité (réussi / à améliorer / échec) est dérivée du ratio obtenu :

≥ 0,85 → réussi
≥ 0,40 → à améliorer
< 0,40 → échec

Notation globale

Excellent≥ 80
Bon60-79
Moyen40-59
À risque< 40

Limites assumées

On lit le HTML rendu sans JavaScript — c'est délibéré, c'est ce que voient ChatGPT/Claude/Perplexity lors de leur crawl.
Les heuristiques sont rapides et lisibles, pas une vérité absolue. Un site peut techniquement avoir un mauvais score et être très cité (cas rare mais possible).
Le module « êtes-vous cité par les IA ? » mesure la citation réelle par Claude — module optionnel activé par marque + secteur + ville, nécessite une clé Anthropic côté serveur.

← Retour à l'analyse

Méthodologie

Les 9 critères et leur poids

Rendu serveur

Données structurées (JSON-LD)

Structure « réponse d'abord »

Fraîcheur du contenu

HTML sémantique

Métadonnées SEO

Accès des crawlers IA

Richesse en entités

Fichier llms.txt

Calcul du score

Notation globale

Limites assumées