Méthodologie
ScoreGeo analyse votre URL côté serveur : on récupère votre HTML brut, votre /robots.txt et votre /llms.txt, puis on évalue 9 critères pondérés à 100 points au total.
Les 9 critères et leur poids
- 20
Rendu serveur
On récupère le HTML brut sans exécuter le JavaScript. On compte les mots visibles : un SPA dont le contenu n'apparaît qu'après hydratation est quasi invisible pour les LLM.
- 20
Données structurées (JSON-LD)
Extraction de tous les blocs <script type="application/ld+json"> (y compris @graph récursif). Bonus pour les types très exploités par les IA : FAQPage, HowTo, LocalBusiness, Product.
- 10
Structure « réponse d'abord »
On cherche le premier paragraphe significatif dans <main>/<article>/après le H1. Sweet spot : 15-80 mots, ≤ 600 caractères. C'est le format que les LLM extraient en citation directe.
- 10
Fraîcheur du contenu
dateModified/datePublished du JSON-LD + balises <time datetime>. Une page de moins de 6 mois est valorisée, > 36 mois pénalisée.
- 10
HTML sémantique
Un seul <h1>, hiérarchie de titres cohérente (pas de saut h2→h4), <main> unique, présence de <article> ou <section>.
- 10
Métadonnées SEO
title (30-65 car.), meta description (70-160 car.), canonical, OpenGraph (title/description/image/type), Twitter Card. Ces signaux servent aussi aux LLM pour résumer.
- 10
Accès des crawlers IA
Parsing de /robots.txt. On vérifie l'accès des 6 crawlers IA majeurs : GPTBot, ChatGPT-User, Google-Extended (Gemini & AI Overviews), ClaudeBot, PerplexityBot, CCBot.
- 5
Richesse en entités
Compteur de chiffres, listes, tableaux, definition-lists, questions FAQ-style (« Comment… ? », « Pourquoi… ? »). Plus le contenu est dense en entités, plus il est citable.
- 5
Fichier llms.txt
Présence d'un fichier /llms.txt à la racine (standard émergent proposé par Jeremy Howard) qui pointe les LLM vers vos contenus prioritaires en Markdown.
Calcul du score
Chaque critère renvoie une note normalisée entre 0 et 1, multipliée par son poids. La somme donne le score global sur 100. Une sévérité (réussi / à améliorer / échec) est dérivée du ratio obtenu :
- ≥ 0,85 → réussi
- ≥ 0,40 → à améliorer
- < 0,40 → échec
Notation globale
- Excellent≥ 80
- Bon60-79
- Moyen40-59
- À risque< 40
Limites assumées
- On lit le HTML rendu sans JavaScript — c'est délibéré, c'est ce que voient ChatGPT/Claude/Perplexity lors de leur crawl.
- Les heuristiques sont rapides et lisibles, pas une vérité absolue. Un site peut techniquement avoir un mauvais score et être très cité (cas rare mais possible).
- Le module « êtes-vous cité par les IA ? » mesure la citation réelle par Claude — module optionnel activé par marque + secteur + ville, nécessite une clé Anthropic côté serveur.