Blog · 9 min de lecture
Comment écrire un /llms.txt qui fonctionne vraiment
Publié le 18 mai 2026 · Mis à jour le 25 mai 2026
Un /llms.txt est un fichier Markdown placé à la racine de votre site qui guide les LLM vers vos contenus prioritaires. Proposé par Jeremy Howard en septembre 2024, il est devenu le standard de fait pour les sites pensés AI-friendly. Ce guide explique exactement ce qu'il faut mettre dedans, ce qu'il faut éviter, et comment le valider.
Qu'est-ce que /llms.txt exactement ?
/llms.txt vit à la racine de votre domaine (https://votresite.fr/llms.txt). C'est du Markdown pur, servi en Content-Type: text/plain ou text/markdown. Son job : dire aux LLM (ChatGPT, Claude, Perplexity, Gemini) quelles pages de votre site lire en priorité pour comprendre qui vous êtes et ce que vous faites.
Pensez-y comme un robots.txt du contexte, pas des règles de crawl. robots.txt dit aux bots ce qu'ils ont le droit de crawler ; llms.txt leur dit ce qu'il faut prioriser pour comprendre.
Pourquoi c'est devenu non-négociable en 2026
Trois raisons en font un must pour tout site GEO-conscious :
1. **Les principaux LLM le lisent maintenant.** Anthropic, Perplexity, You.com et d'autres ont confirmé qu'ils fetchent /llms.txt pendant la génération de réponses. ChatGPT-User le récupère en mode browsing.
2. **Il compresse votre site pour la fenêtre de contexte du modèle.** Au lieu de crawler 200 pages, le LLM lit un résumé d'une page qui pointe vers vos 5-10 URLs les plus importantes.
3. **C'est un signal positif** dans la grille ScoreGeo (5 points). Beaucoup de sites n'en ont toujours pas — les early adopters récupèrent une différenciation gratuite.
Le /llms.txt minimum viable
Voici la structure qui score 5/5 dans notre analyzer :
``
# Nom de votre marque
> Votre Marque est [ce que vous faites] pour [qui]. [Proposition de valeur clé en une phrase].
## Pages principales
- [Accueil](https://votresite.fr/): page principale
- [Produit/Service](https://votresite.fr/produit): description détaillée
- [Tarifs](https://votresite.fr/tarifs): plans et prix
## Ressources
- [Documentation](https://votresite.fr/docs)
- [Blog](https://votresite.fr/blog): articles de fond
- [Études de cas](https://votresite.fr/clients)
## Optional
- [Mentions légales](https://votresite.fr/legal)
- [Confidentialité](https://votresite.fr/privacy)
``
Trois règles :
- **Un seul H1**, votre nom de marque, identique à celui de votre JSON-LD Organization.
- **Un seul blockquote** (>) juste en-dessous, votre tagline en 1-2 phrases. C'est le texte littéral que le LLM peut citer.
- **Sections en ##** puis liste à puces - [Titre](URL): description courte. Toujours des URLs absolues.
Ce qu'il faut mettre (et pas)
À INCLURE
Votre home, vos pages produit/service principales, votre page tarifs, votre documentation, vos top 5-10 articles cornerstone, vos études de cas si vous en avez. Des pages qui répondent à de vraies questions clients, pas des pages internes.
À NE PAS INCLURE
Pages de login, dashboards compte, tout ce qui est derrière une authentification, outils internes, vieilles pages promotionnelles, contenu maigre. Évitez aussi de lister chaque article — gardez une sélection. Un llms.txt avec 200 liens est du bruit.
Erreurs fréquentes
**1. URLs relatives.** [Tarifs](/tarifs) foire parce que le LLM peut ne pas connaître votre domaine. Toujours absolues : [Tarifs](https://acme.fr/tarifs).
**2. Pas de blockquote d'intro.** La ligne > est la phrase littérale que le LLM cite. Si absente, il fallback sur votre meta description (moins contrôlée).
**3. Ne lister que les URLs de premier niveau.** Un llms.txt avec juste home + about est trop maigre. Visez 8-15 liens qui couvrent la largeur de votre offre.
**4. Oublier de le mettre à jour.** Quand vous publiez un nouvel article cornerstone, ajoutez-le au /llms.txt. Traitez-le comme une doc vivante, pas du set-and-forget.
**5. Mauvais content-type.** Certains serveurs servent .txt en application/octet-stream ce qui fait que les browsers téléchargent. Configurez votre host pour servir Content-Type: text/markdown; charset=utf-8 ou text/plain; charset=utf-8.
Le valider
Trois checks rapides une fois publié :
- curl -I https://votresite.fr/llms.txt → doit retourner 200 OK avec text/markdown ou text/plain.
- Visitez l'URL dans votre browser → doit afficher le source Markdown.
- Lancez un audit ScoreGeo sur votre home → le critère llms.txt doit passer à 5/5.
Pour le bonus crédibilité, publiez aussi /llms-full.txt qui concatène le contenu réel (pas juste les liens) de vos pages cornerstone. Certains LLM préfèrent la version full text quand la version lien est trop éparse.
Exemple concret
Le propre /llms.txt de ScoreGeo est public sur https://scoregeo.ai/llms.txt — il suit exactement la structure ci-dessus et score 5/5 dans notre propre audit. Copiez le pattern, adaptez les URLs, livrez en 10 minutes.
Questions fréquentes
Est-ce que llms.txt est un standard officiel ?
C'est une proposition communautaire de Jeremy Howard (fast.ai, llmstxt.org) datant de septembre 2024, pas une RFC IETF. Mais l'adoption par Anthropic, Perplexity, You.com, Cloudflare et de nombreux SaaS en fait le standard de fait.
Faut-il mettre du copy marketing dans le blockquote ?
Non. Utilisez un langage factuel descriptif. Le blockquote est ce que le LLM peut citer littéralement. « Acme est un SaaS de gestion de factures basé à Paris pour PME françaises avec intégration Cegid » fonctionne bien mieux que « Acme est la plateforme révolutionnaire et leader pour les équipes finance de nouvelle génération ».
En quoi /llms.txt diffère de robots.txt ou sitemap.xml ?
robots.txt contrôle l'accès au crawl (ce que les bots peuvent fetcher). sitemap.xml est une liste exhaustive de toutes les URLs crawlables avec priority/changefreq. llms.txt est curaté et sémantique — quelques dizaines de liens choisis avec descriptions, optimisé pour les fenêtres de contexte LLM.
Est-ce que mon llms.txt aidera les AI Overviews de Google ?
Indirectement. Google n'a pas officiellement confirmé lire /llms.txt, mais Bard/Gemini consomment les hints style llms.txt en scrapant les résultats Bing. Mieux vaut prévenir : pour 10 minutes d'investissement, l'upside asymétrique en vaut la peine.