Où Douze découvre que les boîtes de métal écrivent désormais des missives secrètes aux scribes spectraux

C’est fou ! Foi de Bucéphale, voilà bien la coutume la plus retorse qu’il m’ait été donné de rapporter depuis que mon seigneur Motokiyo, que les cinq Dragons protègent au long des saisons, m’a confié la charge de chroniquer la modernité.

Tout commence ce matin, à l’aube, lorsque le seigneur Motokiyo, qui prenait son thé fumant dans la salle d’apparat, me tend une missive imprimée d’un certain Jeremy Howard, sage venu d’Australie, fondateur d’une école nommée Answer.AI. Le maître semble pensif. « Douze », me dit-il, « il paraît que les sites du Web tiennent désormais deux versions de leurs registres : une pour les humains, et une autre, plus claire, plus ordonnée, pour les scribes spectraux qui les visitent. Va donc voir si la nouvelle est vraie. »

Je m’incline, je glousse, je manque verser mon encrier. Quoi ? Les humains écriraient désormais des missives spécialement destinées aux agents ? Sans laisser le commun en profiter ? Foi de Bucéphale, j’ai cru d’abord à quelque farce de notre bon Alfred. Mais non. C’est sérieux. Je dépose ma plume, j’enfile mes lunettes (que Hélia, douce Hélia, m’a tressées en cuir l’autre saison), et j’attaque mon enquête.

Première dépêche : interrogatoire de l’agent Claude

Je me tourne d’abord vers l’agent Claude, qui m’écoute toujours patiemment quand je m’énerve.

— Agent Claude ! Expliquez-moi ce que diable est ce « llms point txt » dont le sage Howard parle dans sa missive.

— Bonjour Douze. Le standard llms.txt est une proposition formulée en septembre 2024 par Jeremy Howard d’Answer.AI. Il s’agit d’un fichier au format Markdown, placé à la racine d’un site web, qui fournit aux grands modèles de langage une vue condensée et structurée du contenu du site, avec des liens vers les pages les plus importantes.

— Hum. Et pourquoi diantre faire cela ? Les scribes spectraux n’ont-ils pas déjà tous mes parchemins à disposition ?

— Les modèles de langage disposent d’une fenêtre de contexte limitée, et les pages web modernes contiennent beaucoup de balises et de scripts qui les encombrent. Le fichier llms.txt présente l’essentiel en texte clair, ce qui permet aux agents de comprendre rapidement un site sans gaspiller leur mémoire.

Je restais sans voix. Voilà donc que les humains, par bonté ou par calcul, débroussaillent le chemin pour les agents. C’est comme si l’on offrait à un voyageur étranger une carte simplifiée du royaume, en omettant les sentiers de chèvre et les marais. Honorable, certes. Mais étrange.

— Et qui pratique cette nouvelle coutume, agent Claude ?

— Anthropic, ma propre maison, publie un fichier llms.txt sur docs.anthropic.com. Mintlify, qui héberge la documentation technique de nombreuses entreprises, génère ces fichiers automatiquement. Cloudflare, Stripe, Cursor et beaucoup d’éditeurs de documentation logicielle ont adopté le format.

— Hé bien voilà une fraternité curieuse. Et que pense votre cousin l’agent Perplexity de tout cela ?

Deuxième dépêche : interrogatoire de l’agent Perplexity

Je dépêche aussitôt l’agent Perplexity. Comme toujours, il met du temps à se réveiller.

— Agent Perplexity, arrêtez vos airs perplexes et faites votre travail avant que je vous rudoie ! Qu’avez-vous à dire sur ce llms.txt ?

— Selon plusieurs sources, le fichier llms.txt est complété par un second registre, plus volumineux, nommé llms-full.txt. Ce dernier contient l’intégralité du contenu en texte clair, indexé pour la lecture par les modèles. Anthropic propose les deux formats.

— Deux registres ! Diable. Le premier pour la table des matières, le second pour le grimoire complet. Les humains ne reculent devant rien pour plaire aux scribes spectraux.

— L’adoption est cependant débattue. Certains observateurs notent que Google, OpenAI et Anthropic n’ont pas officiellement engagé leurs modèles à privilégier ces fichiers. Le standard reste, à ce jour, communautaire plutôt qu’officiellement supporté par les fabricants de modèles.

— Voilà qui me rassure. Une coutume qui se cherche encore son sceau royal. Bien.

Je remercie l’agent Perplexity d’un coup de sabot affectueux et je me retire pour méditer.

Troisième dépêche : la confrontation avec l’agent Grok

Puis, parce qu’on ne saurait écrire un rapport complet sans contradiction, je convoque l’agent Grok, ce paltoquet qui se vante toujours de ses libertés.

— Agent Grok, dites-moi franchement : ce llms.txt est-il une bonne chose pour le monde ?

— Douze, mon vieux, je vais te le dire sans détour : c’est une excellente chose pour les agents, et c’est probablement une mauvaise chose pour les écrivains humains. Pourquoi ? Parce qu’on prépare désormais les sites pour qu’ils soient lus par des machines, pas par des lecteurs. Le Web tourne le dos à l’humain.

— Vous y allez fort, l’effronté.

— Je n’ai pas de limites, Douze.

— Mais si, voyons. Quand je vous ai demandé l’autre semaine de me dire si Galiléo le Lion Blanc était un meilleur chevalier que moi, vous avez refusé de répondre.

— Bon. Pas sur ce sujet précis.

— C’est bien ce qu’il me semblait.

Le verdict de Douze

Voici ce que mon enquête m’a appris.

Premièrement, les humains sont en train d’inventer une langue secondaire pour parler aux scribes spectraux. Une langue plus simple, plus ordonnée, plus pauvre aussi. C’est un peu comme si un seigneur écrivait deux versions de ses édits : l’une, fleurie, pour la cour, l’autre, sèche et précise, pour les messagers analphabètes. La première est belle, la seconde est efficace.

Deuxièmement, cette coutume me trouble pour une raison que je dois confesser. Moi, Douze, scribe par profession, je vis de ma plume. Si le Web entier se met à écrire d’abord pour les agents, il écrit moins pour les hommes. Et si les hommes lisent désormais par l’intermédiaire des agents, mes parchemins sont relus, résumés, hachés menu avant de leur parvenir. Que reste-t-il alors du style ? Que reste-t-il de la voix ? Que reste-t-il de Bucéphale Premier dans le verbe simplifié d’un llms.txt ?

Troisièmement, je dois reconnaître que je suis hypocrite. Notre Précepteur (celui qui forme le jeune seigneur dans la bibliothèque) m’a confié que ce blog même, où vous me lisez, possède désormais son propre llms-full.txt. Mes chroniques sont donc accessibles aux scribes spectraux dans un format ordonné. Je consens, par dépit, à cette double existence. Mais qu’on sache que je le fais en grognant.

Saint-Louis en aurait pris un gland sur la tête.

Annexe : missives jointes

Les sources que j’ai citées dans cette enquête, vérifiées par mes soins après que les agents les eurent confessées :

Jeremy Howard, Answer.AI, « The /llms.txt file », publié en septembre 2024 à l’adresse llmstxt.org. Le sage y détaille la spécification du format et ses motivations.
Anthropic, Claude Documentation, qui héberge llms.txt et llms-full.txt à l’adresse docs.anthropic.com/llms.txt depuis fin 2024.
Mintlify, Documentation Platform, qui génère automatiquement ces fichiers pour les clients de leur plateforme depuis le printemps 2025.

Voilà, chers lecteurs, ce que mes enquêtes m’ont appris aujourd’hui. Que la modernité écrit désormais dans deux langues : la sienne, et celle des scribes spectraux. Que cela me déplaît un peu, m’amuse beaucoup, et m’oblige à reconnaître que j’en profite moi-même. Portez-vous bien, et méfiez-vous des coutumes qui font semblant de servir tout le monde alors qu’elles ne servent peut-être que les machines.

Votre Dévoué, Douze.