Glossaire GEO 2026 : 30 termes essentiels à connaître

8 min de lecturePublié le 3 juin 2026

Le vocabulaire du GEO s'est cristallisé entre 2024 et 2026, à mesure que ChatGPT, Claude, Perplexity et Google AI Overview sont devenus des canaux d'acquisition mesurables. En avril 2026, Sistrix mesurait 58% des requêtes Google FR qui déclenchent un AI Overview, et Ahrefs avait analysé 75 000 marques pour cartographier les patterns de citation IA. Pourtant, les termes flottent encore : answer-first, llms.txt, embedding, chunk, OAI-SearchBot, mention sans lien… ce glossaire fixe les définitions utiles à un responsable SEO, à un fondateur SaaS ou à un consultant qui doit cadrer un audit. Trente termes, classés par usage, avec la nuance technique nécessaire pour ne pas confondre crawler d'entraînement et crawler de réponse, ou citation et mention de marque.

Les fondamentaux : GEO, AEO, LLM SEO

Trois acronymes pour une même bataille : être visible quand un utilisateur pose une question à une IA générative. Les nuances comptent en interne mais convergent en pratique sur les mêmes leviers techniques et éditoriaux.

1. GEO (Generative Engine Optimization)

Optimisation d'un site pour être cité par les moteurs génératifs (ChatGPT, Claude, Perplexity, Gemini, Google AI Overview). Terme popularisé par le papier de Princeton, Allen Institute et Georgia Tech publié en novembre 2023, qui démontrait des gains de visibilité de 30 à 40% sur certaines techniques de réécriture.

2. AEO (Answer Engine Optimization)

Synonyme fréquent de GEO, avec une nuance : AEO insiste sur le format réponse (questions, FAQ, snippets) tandis que GEO englobe aussi le contenu long et la couche autorité. Dans la plupart des briefs clients en 2026, les deux termes sont interchangeables.

3. LLM SEO

Variante anglo-saxonne, encore utilisée par certaines agences. Désigne strictement l'optimisation pour les Large Language Models, sans inclure les moteurs hybrides type Perplexity qui mixent recherche et génération.

Les crawlers IA à connaître

Un crawler IA est un robot qui visite votre site pour deux raisons distinctes : entraîner un modèle, ou répondre en temps réel à une requête utilisateur. La distinction est cruciale car elle dicte la politique robots.txt à appliquer.

4. GPTBot

Crawler d'entraînement d'OpenAI, documenté publiquement. User-agent : GPTBot. Selon Vercel et MERJ, GPTBot a généré plus de 500 millions de fetches sur leur infrastructure en 2024-2025. À autoriser si vous voulez nourrir les futurs modèles GPT.

5. OAI-SearchBot

Crawler de réponse d'OpenAI, utilisé par ChatGPT Search pour aller chercher des sources en temps réel. Documenté publiquement par OpenAI. C'est lui qu'il faut autoriser en priorité pour être cité dans les réponses ChatGPT actuelles.

6. ClaudeBot

Crawler d'Anthropic, documenté publiquement. Sert à la fois pour l'entraînement et pour les fonctionnalités de recherche de Claude. Un seul user-agent, ce qui simplifie la gestion mais empêche le blocage sélectif.

7. PerplexityBot

Crawler de Perplexity, qui combine indexation et fetch à la demande. Particulièrement actif sur les contenus B2B SaaS et techniques.

8. Google-Extended

Token spécifique pour signaler à Google de ne pas utiliser votre contenu dans Bard/Gemini, sans bloquer Googlebot classique. Permet de séparer SEO traditionnel et entraînement IA Google.

Les formats citables par les LLM

Un LLM ne lit pas une page comme un humain : il découpe, vectorise, classe par pertinence. Les formats qui maximisent la citation partagent trois propriétés : autonomie sémantique, structure prédictible, faits sourçables.

9. Answer-first

Principe rédactionnel consistant à donner la réponse en 1-2 phrases dès l'ouverture d'un H2 ou d'un paragraphe, avant tout développement. C'est le format le plus extrait par les LLM selon les patterns observés dans les études Yext et Semrush.

10. JSON-LD

Format structuré recommandé par schema.org pour décrire vos entités (Article, FAQPage, Organization, HowTo). Selon Ahrefs (mars 2026, 1 885 pages testées), les pages avec JSON-LD valide sont citées 2 à 3 fois plus souvent par ChatGPT.

11. llms.txt

Fichier texte à la racine du site, proposé en 2024 par Jeremy Howard, qui résume le contenu d'un site dans un format optimisé pour les LLM. Adoption encore minoritaire en 2026 mais signal positif pour les moteurs qui le supportent.

12. Chunk

Unité de découpage d'un document avant vectorisation. Un LLM ne cite jamais une page entière : il cite un chunk de 200 à 800 tokens. Optimiser chaque section pour être autonome, c'est optimiser au niveau chunk.

13. Embedding

Représentation vectorielle d'un texte, utilisée par les LLM pour mesurer la similarité sémantique avec une requête. Deux contenus peuvent être cités pour la même question si leurs embeddings sont proches du vecteur de la question.

14. RAG (Retrieval Augmented Generation)

Architecture où le LLM va chercher des documents externes avant de générer sa réponse. Perplexity, ChatGPT Search et AI Overview fonctionnent en RAG : votre contenu n'a pas besoin d'être dans le modèle, il doit être trouvable au moment de la requête.

Les métriques GEO essentielles

Une fois le vocabulaire technique posé, les indicateurs business deviennent lisibles. Trois familles : visibilité (vous êtes cité), qualité (vous êtes bien cité), conversion (vous êtes cliqué).

15. Citation

Mention de votre site comme source dans une réponse IA, avec ou sans lien cliquable. Selon Yext (6,8 millions de citations analysées), la citation est l'indicateur le plus corrélé au trafic IA mesurable.

16. Mention de marque

Apparition du nom de votre marque dans une réponse IA, même sans lien. Ahrefs (mars 2026, 75 000 marques) a montré que la mention de marque sans lien représente 60 à 70% des occurrences en B2B SaaS.

Part de vos citations sur l'ensemble des citations d'un cluster sémantique (ex : tous les outils de CRM). Métrique de référence pour benchmarker contre vos concurrents.

18. AI Overview

Réponse générée par Google en haut des SERP, avec sources citées. Sistrix mesurait 58% des requêtes Google FR qui déclenchent un AI Overview en avril 2026. Apparaître dans ses sources est devenu un objectif SEO à part entière.

19. Citabilité

Score qualitatif mesurant la probabilité qu'un contenu soit cité par un LLM. La méthodologie ScoreGeo évalue 13 critères pondérés sur 100 points pour produire ce score.

Les leviers off-page et autorité

Les LLM héritent en partie de la logique SEO classique : autorité, fraîcheur, signaux d'expertise. Mais ils ajoutent une couche propre, centrée sur la cohérence sémantique entre vos mentions tierces.

20. Off-page authority

Ensemble des signaux externes (backlinks, mentions presse, profils LinkedIn cohérents, Wikipédia) qui contribuent à l'autorité perçue par un LLM. Travailler son off-page authority reste le levier le moins automatisable et le plus durable.

21. E-E-A-T appliqué aux LLM

Experience, Expertise, Authoritativeness, Trustworthiness. Le framework Google s'étend aux LLM : ils favorisent les sources avec auteur identifié, méthodologie publique, date de mise à jour, et contre-références externes.

22. Co-citation IA

Apparition simultanée de votre marque avec une marque de référence dans une même réponse IA. Indicateur puissant de positionnement perçu par les modèles.

23. Wikipedia entity

Présence d'une page Wikipédia validée pour votre marque ou votre fondateur. Les LLM s'appuient massivement sur Wikipédia comme source de vérité d'entité.

Les pratiques techniques côté serveur

Côté infrastructure, trois sujets reviennent dans tous les audits GEO : qui peut crawler quoi, à quelle fréquence, et avec quelle empreinte performance.

24. robots.txt étendu

Fichier robots.txt qui distingue explicitement les crawlers IA. Convention de 2026 : autoriser OAI-SearchBot, ClaudeBot, PerplexityBot, et arbitrer GPTBot selon votre stratégie d'entraînement.

25. Sitemap fraîcheur

Champ lastmod actualisé à chaque édition. Les crawlers IA, particulièrement OAI-SearchBot, priorisent les URL fraîchement modifiées pour rafraîchir leurs réponses.

26. SSR (Server-Side Rendering)

Rendu côté serveur. La plupart des crawlers IA exécutent peu ou pas de JavaScript. Un site full client-side risque de servir une coquille vide aux LLM.

27. Markdown propre

Structure HTML simple, H1-H2-H3 hiérarchisés, listes vraiment listes (<ul>, <ol>), tableaux sémantiques. Les LLM extraient mieux un markdown propre qu'un HTML cosmétique.

Pour un audit complet de ces signaux techniques, consultez notre méthodologie ScoreGeo qui détaille les 13 critères pondérés. Si vous préférez une assistance opérationnelle, l'accompagnement GEO de notre équipe couvre l'ensemble du chantier en 6 semaines.

Les indicateurs de conversion IA

Mesurer l'impact business du GEO suppose des indicateurs propres, distincts du SEO classique. Trois métriques émergent comme standards en 2026.

28. Trafic référer IA

Visites identifiées comme provenant d'une réponse IA (referer ChatGPT, Perplexity, Claude, ou paramètre UTM ajouté manuellement). Représente la part directement attribuable du GEO.

29. Branded query lift

Augmentation des recherches sur votre marque suite à une exposition IA. Mesurable via Search Console (impressions sur requêtes brandées). Souvent le premier signal mesurable d'un GEO qui fonctionne.

30. AI assist rate

Part des conversions B2B où le prospect mentionne avoir découvert ou validé votre solution via une IA. Indicateur déclaratif à intégrer dans les formulaires de démo ou les entretiens commerciaux.

Trente termes ne couvrent pas tout : le vocabulaire GEO continue d'évoluer chaque trimestre. Pour rester à jour, l'inscription à la newsletter ScoreGeo donne accès aux mises à jour de ce glossaire et aux nouveaux concepts dès qu'ils stabilisent.

Comment utiliser ce glossaire

Un glossaire ne sert qu'à clarifier des conversations. Trois usages concrets : avant un audit, pour aligner le vocabulaire avec votre prestataire ; pendant la rédaction, pour vérifier qu'un brief utilise les bons termes ; après un déploiement, pour mesurer ce qui doit l'être. Si certains termes restent flous après lecture, c'est probablement le signal qu'un audit GEO manuel apporterait plus de valeur qu'une auto-formation. La distinction GEO vs SEO, en particulier, mérite souvent une session dédiée pour éviter les arbitrages mal posés sur les erreurs GEO classiques.

Questions fréquentes

Quelle différence entre GEO et SEO classique ?

Le SEO classique optimise pour le ranking dans les pages de résultats (Google, Bing). Le GEO optimise pour la citation par les moteurs génératifs (ChatGPT, Claude, Perplexity, AI Overview). Les leviers se recoupent à 60-70% (qualité de contenu, structure, autorité) mais le GEO ajoute des spécificités : format answer-first, JSON-LD strict, autorisation des crawlers IA, mentions de marque tierces.

Faut-il bloquer GPTBot pour protéger son contenu ?

Bloquer GPTBot empêche votre contenu d'entraîner les futurs modèles GPT, mais n'a aucun effet sur votre citation actuelle dans ChatGPT Search, qui passe par OAI-SearchBot. Pour la plupart des entreprises B2B SaaS qui veulent maximiser la visibilité IA, bloquer GPTBot est contre-productif. Pour un éditeur de contenu premium, le blocage peut se justifier.

Le fichier llms.txt est-il obligatoire en 2026 ?

Non, llms.txt reste une convention émergente, pas un standard imposé par les moteurs IA majeurs. Son adoption est minoritaire et son impact mesuré reste limité. Il ne coûte rien à mettre en place et peut servir de signal positif, mais ce n'est pas une priorité par rapport à un JSON-LD propre et un robots.txt bien configuré.

Comment mesurer si on est cité par ChatGPT ?

Trois méthodes : (1) interroger ChatGPT manuellement sur 20 à 50 requêtes cibles et noter les citations ; (2) utiliser un outil de monitoring GEO qui automatise ces requêtes ; (3) analyser le trafic referer dans GA4 ou Plausible (referer chat.openai.com, perplexity.ai, claude.ai). Le manuel reste le plus fiable pour démarrer.

Combien de termes du glossaire faut-il maîtriser pour démarrer ?

Pour un premier chantier GEO, dix termes suffisent : GEO, answer-first, JSON-LD, GPTBot, OAI-SearchBot, ClaudeBot, citation, mention de marque, share of voice IA, RAG. Les vingt autres deviennent utiles au fur et à mesure de la maturité, notamment pour benchmarker contre les concurrents ou pour arbitrer techniquement.

Quels termes sont les plus nouveaux en 2026 ?

Les concepts qui ont émergé sur 2025-2026 sont : OAI-SearchBot (distinct de GPTBot), share of voice IA comme métrique formalisée, co-citation IA, branded query lift attribué au GEO, et AI assist rate déclaratif en B2B. Les fondamentaux (answer-first, JSON-LD, citation) sont stables depuis 2023-2024.

Ce glossaire est-il maintenu à jour ?

Oui, ScoreGeo révise ce glossaire à chaque trimestre pour refléter les évolutions de vocabulaire et les nouveaux signaux mesurables. Les ajouts récents sont signalés en début d'article. Pour être notifié des mises à jour, l'inscription à la newsletter reste le moyen le plus simple.