ScoreGeo

Comment écrire un /llms.txt qui fonctionne vraiment

9 min de lecturePublié le 18 mai 2026

Un /llms.txt est un fichier Markdown placé à la racine de votre site qui guide les LLM vers vos contenus prioritaires. Proposé par Jeremy Howard en septembre 2024, il est devenu le standard de fait pour les sites pensés AI-friendly. Ce guide explique exactement ce qu'il faut mettre dedans, ce qu'il faut éviter, et comment le valider.

Qu'est-ce que /llms.txt exactement ?

/llms.txt vit à la racine de votre domaine (https://votresite.fr/llms.txt). C'est du Markdown pur, servi en Content-Type: text/plain ou text/markdown. Son job : dire aux LLM (ChatGPT, Claude, Perplexity, Gemini) quelles pages de votre site lire en priorité pour comprendre qui vous êtes et ce que vous faites.

Pensez-y comme un robots.txt du contexte, pas des règles de crawl. robots.txt dit aux bots ce qu'ils ont le droit de crawler ; llms.txt leur dit ce qu'il faut prioriser pour comprendre.

Qui lit vraiment /llms.txt en 2026 (réponse honnête)

L'adoption est asymétrique, lisez ça avant d'investir :

1. **Google a confirmé ne pas l'utiliser.** Gary Illyes (équipe Google Search) l'a déclaré publiquement le 24 juillet 2025 : « Google doesn't support llms.txt and isn't planning to ». John Mueller le compare à la meta keywords obsolète. Donc si les AI Overviews sont votre cible principale, /llms.txt ne bougera pas l'aiguille.

2. **Anthropic et Perplexity reconnaissent le fetcher** pendant la génération de réponses. ChatGPT-User le récupère en mode browsing. Les études contrôlées (Vercel+MERJ, >500M fetches crawler) ne confirment pas le fetch lors des crawls de base GPTBot/ClaudeBot/PerplexityBot, mais ces bots ne sont pas le seul chemin d'accès.

3. **C'est un signal positif** dans la grille ScoreGeo (le poids exact du critère est documenté sur scoregeo.ai/methodology). Beaucoup de sites n'en ont toujours pas, donc c'est de la différenciation gratuite sur une convention encore émergente.

4. **Il compresse votre site pour la fenêtre de contexte** quand un LLM le fetch. Au lieu de crawler 200 pages, il lit un résumé d'une page qui pointe vers vos 5-10 URLs les plus importantes. Upside asymétrique pour 10 minutes de travail.

Bottom line : livrez-le si vous visez 100/100 sur ScoreGeo ou si vous voulez une couverture belt-and-suspenders du standard émergent. Skip-le si votre budget de scoring est tendu et que vous avez plus gros à faire (paragraphe answer-first, JSON-LD, fraîcheur).

Le /llms.txt minimum viable

Voici la structure qui score 1/1 dans notre analyzer :

`` # Nom de votre marque > Votre Marque est [ce que vous faites] pour [qui]. [Proposition de valeur clé en une phrase]. ## Pages principales - [Accueil](https://votresite.fr/): page principale - [Produit/Service](https://votresite.fr/produit): description détaillée - [Tarifs](https://votresite.fr/tarifs): plans et prix ## Ressources - [Documentation](https://votresite.fr/docs) - [Blog](https://votresite.fr/blog): articles de fond - [Études de cas](https://votresite.fr/clients) ## Optional - [Mentions légales](https://votresite.fr/legal) - [Confidentialité](https://votresite.fr/privacy) ``

Trois règles :

- **Un seul H1**, votre nom de marque, identique à celui de votre JSON-LD Organization.

- **Un seul blockquote** (>) juste en-dessous, votre tagline en 1-2 phrases. C'est le texte littéral que le LLM peut citer.

- **Sections en ##** puis liste à puces - [Titre](URL): description courte. Toujours des URLs absolues.

Ce qu'il faut mettre (et pas)

À INCLURE

Votre home, vos pages produit/service principales, votre page tarifs, votre documentation, vos top 5-10 articles cornerstone, vos études de cas si vous en avez. Des pages qui répondent à de vraies questions clients, pas des pages internes.

À NE PAS INCLURE

Pages de login, dashboards compte, tout ce qui est derrière une authentification, outils internes, vieilles pages promotionnelles, contenu maigre. Évitez aussi de lister chaque article, gardez une sélection. Un llms.txt avec 200 liens est du bruit.

Erreurs fréquentes

**1. URLs relatives.** [Tarifs](/tarifs) foire parce que le LLM peut ne pas connaître votre domaine. Toujours absolues : [Tarifs](https://acme.fr/tarifs).

**2. Pas de blockquote d'intro.** La ligne > est la phrase littérale que le LLM cite. Si absente, il fallback sur votre meta description (moins contrôlée).

**3. Ne lister que les URLs de premier niveau.** Un llms.txt avec juste home + about est trop maigre. Visez 8-15 liens qui couvrent la largeur de votre offre.

**4. Oublier de le mettre à jour.** Quand vous publiez un nouvel article cornerstone, ajoutez-le au /llms.txt. Traitez-le comme une doc vivante, pas du set-and-forget.

**5. Mauvais content-type.** Certains serveurs servent .txt en application/octet-stream ce qui fait que les browsers téléchargent. Configurez votre host pour servir Content-Type: text/markdown; charset=utf-8 ou text/plain; charset=utf-8.

Le valider

Trois checks rapides une fois publié :

- curl -I https://votresite.fr/llms.txt → doit retourner 200 OK avec text/markdown ou text/plain.

- Visitez l'URL dans votre browser → doit afficher le source Markdown.

- Lancez un audit ScoreGeo sur votre home → le critère llms.txt doit passer à 1/1.

Pour le bonus crédibilité, publiez aussi /llms-full.txt qui concatène le contenu réel (pas juste les liens) de vos pages cornerstone. Certains LLM préfèrent la version full text quand la version lien est trop éparse.

Exemple concret

Le propre /llms.txt de ScoreGeo est public sur https://scoregeo.ai/llms.txt, il suit exactement la structure ci-dessus et score 1/1 dans notre propre audit. Copiez le pattern, adaptez les URLs, livrez en 10 minutes.

Questions fréquentes

Est-ce que llms.txt est un standard officiel ?

C'est une proposition communautaire de Jeremy Howard (fast.ai, llmstxt.org) datant de septembre 2024, pas une RFC IETF. Mais l'adoption par Anthropic, Perplexity, You.com, Cloudflare et de nombreux SaaS en fait le standard de fait.

Faut-il mettre du copy marketing dans le blockquote ?

Non. Utilisez un langage factuel descriptif. Le blockquote est ce que le LLM peut citer littéralement. « Acme est un SaaS de gestion de factures basé à Paris pour PME françaises avec intégration Cegid » fonctionne bien mieux que « Acme est la plateforme révolutionnaire et leader pour les équipes finance de nouvelle génération ».

En quoi /llms.txt diffère de robots.txt ou sitemap.xml ?

robots.txt contrôle l'accès au crawl (ce que les bots peuvent fetcher). sitemap.xml est une liste exhaustive de toutes les URLs crawlables avec priority/changefreq. llms.txt est curaté et sémantique, quelques dizaines de liens choisis avec descriptions, optimisé pour les fenêtres de contexte LLM.

Est-ce que mon llms.txt aidera les AI Overviews de Google ?

Non, pas directement. L'équipe Google Search (Gary Illyes, juillet 2025) a déclaré publiquement qu'ils n'utilisent pas /llms.txt et n'ont pas l'intention de le faire. Pour les AI Overviews, concentrez-vous plutôt sur le JSON-LD, la fraîcheur et les paragraphes answer-first. /llms.txt reste utile pour le reste de l'écosystème (Anthropic, Perplexity, You.com).

Analyser mon site gratuit