GEO : le guide ultime pour améliorer son référencement sur les moteurs IA & les LLMs

Table des matières

Qu'est-ce que le Generative Engine Optimization ?
Enjeux : pourquoi le GEO est urgent dès maintenant ?
Comment apparaître dans les réponses IA ? La méthodologie Empirik
Etape 1 : Diagnostic & Audit GEO
Etape 2 : Optimisation GEO Owned Media : techniques, structure, contenus, etc
Etape 3 : Optimisation GEO Earned Media : RP, YouTube, Reddit, lining
Etape 4 : Mesure des citations/mentions sur les LLMs & impact sur la performance digitale
Checklist pour définir et mettre en oeuvre une stratégie GEO

Table des matières

Qu'est-ce que le Generative Engine Optimization ?
Enjeux : pourquoi le GEO est urgent dès maintenant ?
Comment apparaître dans les réponses IA ? La méthodologie Empirik
Etape 1 : Diagnostic & Audit GEO
Etape 2 : Optimisation GEO Owned Media : techniques, structure, contenus, etc
Etape 3 : Optimisation GEO Earned Media : RP, YouTube, Reddit, lining
Etape 4 : Mesure des citations/mentions sur les LLMs & impact sur la performance digitale
Checklist pour définir et mettre en oeuvre une stratégie GEO

Faire du GEO semble simple sur le papier : produire du contenu, soigner ses sources et espérer apparaître dans ChatGPT. Sauf qu’en réalité, le CTR organique chute partout (avec ou sans AI Overviews) et les places visibles sont extrêmement limitées. Le principal piège serait de penser qu’il faut opposer SEO et GEO, comme s’il s’agissait de deux disciplines distinctes. Le GEO fait partie intégrante du SEO, il vient l’enrichir. C’est pour cela qu’intégrer cette dimension dans sa stratégie Search globale est devenu indispensable.

Chez Empirik, on a structuré notre approche autour de 3 leviers (Owned, Earned, Technique) et d’une boucle Définir → Déployer → Piloter. On partage ici notre méthodologie complète, étape par étape.

Qu'est-ce que le Generative Engine Optimization ?

Le GEO (Generative Engine Optimization) désigne l’ensemble des actions visant à faire apparaître une marque dans les réponses générées par les moteurs d’IA : ChatGPT, Gemini, Perplexity, et les AI Overviews de Google.

L’objectif n’est pas de “ranker sur ChatGPT” comme on rankerait sur Google. Il s’agit d’augmenter la part de voix conversationnelle d’une marque, la fréquence à laquelle elle est citée en réponse à des requêtes pertinentes, et de s’assurer que cette présence contribue concrètement à ses résultats business.

Chez Empirik, le GEO ne se pratique pas en silo. Il se déploie en synergie avec le SEO, le CRO et la Data. Cette fiche explique comment.

Enjeux : pourquoi le GEO est urgent dès maintenant ?

À retenir :

Le CTR organique chute partout, avec ou sans AIO
Être cité > ne pas être cité (+35% CTR SEO / +91% SEA)
Les LLM influencent avant le clic (branding > trafic)

La fin du clic organique classique

Pendant des années, la mécanique était simple : une requête Google = une liste de liens = des clics vers les sites. Cette mécanique est en train de se briser.

Depuis le déploiement des AI Overviews, Google répond directement aux questions informationnelles sans nécessairement renvoyer vers un site. Le résultat est brutal sur les CTR organiques.

Les chiffres qui font mal

Situation	CTR organique	Evolution YoY
Requête sans AIO	1,62%	-41%
Requête avec AIO, non cité	0,52%	-65%
Requête avec AIO, cité	0,70%	-49%

Source : Seer Interactive — AIO Impact on Google CTR, septembre 2025 – 42 clients, 25,1M impressions organiques, juin 2024 → sept. 2025

Deux points importants à retenir :

Il n’y a pas de zone safe. On pourrait croire que les requêtes sans AIO sont épargnées mais elles ne le sont pas. Elles ont perdu 41% de leur CTR en un an, probablement parce que les utilisateurs commencent leur parcours sur ChatGPT ou Perplexity avant même d’arriver sur Google.
Être cité dans l’AIO change tout. Un CTR à 0,70% face à 0,52% peut sembler anecdotique en valeur absolue, mais c’est +35% de clics organiques supplémentaires. Côté SEA, l’écart est encore plus frappant : +91% de CTR payant pour les annonceurs cités vs non cités.

"Even queries without AI Overviews are seeing 32-41% CTR declines. This isn't just an AIO problem, this is a fundamental shift in how users approach information-seeking."

— Seer Interactive, septembre 2025

À retenir :
La question n'est plus "est-ce que l'AIO va impacter ma marque ?" mais "à quel point est-elle déjà impactée, et est-elle citéé ou invisible ?"

Les LLMs : une visibilité sans clics (pour l'instant)

ChatGPT, Gemini, Perplexity génèrent aujourd’hui moins de 1% du trafic sortant vers les sites web. Ce chiffre peut sembler dérisoire, et objectivement, il l’est encore.

Mais ce n’est pas la bonne façon de lire l’enjeu.

Les LLMs influencent les décisions en amont du clic. Quand un acheteur BtoB demande à ChatGPT “quelle est la meilleure solution de gestion de stock pour un restaurateur ?”, il ne clique peut-être pas immédiatement. Mais la marque qui apparaît dans la réponse installe une préférence. Celle qui n’apparaît pas n’existe pas dans cet instant de décision.

L’enjeu GEO sur les LLMs est aujourd’hui un enjeu de branding et de considération, pas encore de trafic direct. Ça va changer mais même à ce stade, ça n’est pas négligeable pour des marques dont le cycle de vente est long ou dont la décision d’achat est précédée d’une phase de recherche (Source : Empirik – Page GEO)

Ce qui est certain : les positions dans les réponses LLM ne sont pas encore figées. Contrairement au SEO où les premiers rangs sont verrouillés depuis des années, les marques qui investissent aujourd’hui partent avec une longueur d’avance sur celles qui attendront. La fenêtre n’est pas fermée mais elle ne le restera pas indéfiniment.

Être cité dans l'AIO : un avantage compétitif mesurable

La citation dans les AI Overviews n’est pas seulement un enjeu de visibilité, elle a un impact direct et mesurable sur les performances, y compris en dehors du SEO.

L'avantage de la citation - chiffres Q3 2025

Tableau

	Pas d'AIO	AIO non cité	AIO cité
CTR organique	1,62%	0,52%	0,70%
CTR payant	13,04%	4,14%	7,89%
Écart vs non-cité	-	référence	+35% organique ; +91% payant

Source : Seer Interactive, septembre 2025 + Search Engine Land

Ce que ça implique pour les entreprises qui font du SEA : si leurs campagnes ciblent des requêtes informationnelles exposées aux AIO et qu’ils ne sont pas cités, leur CPL explose sans que leur CPC bouge. Le volume de clics s’effondre silencieusement. C’est un argument fort pour embarquer le pôle Paid dans la réflexion GEO dès le départ.

Nuance à avoir en tête : la causalité n’est pas prouvée. Il est possible que les marques citées aient simplement plus d’autorité, ce qui expliquerait à la fois leur citation ET leur meilleur CTR. Mais dans un sens comme dans l’autre, l’action à mener est identique : travailler l’autorité et la présence éditoriale.

Transformez les réponses IA en valeur business

Comment apparaître dans les réponses IA ? La méthodologie Empirik

À retenir :

Le GEO repose sur 3 leviers :
Et une boucle : Définir → Déployer → Piloter
Le SEO est nécessaire mais insuffisant

Avant de rentrer dans les techniques, il faut poser le cadre. Le GEO est une discipline jeune, et beaucoup d’acteurs la pratiquent de façon désordonnée, une action Reddit par-ci, un contenu “optimisé pour l’IA” par-là, sans cohérence ni mesure. Ce n’est pas notre approche.

Chez Empirik, le GEO s’articule autour de 3 leviers, d’une boucle méthodologique en 3 étapes, et d’un principe fondamental : on ne sépare pas le GEO du SEO.

Les 3 leviers du GEO

Tout ce qu’on peut faire en GEO rentre dans l’une de ces trois cases. C’est la grille de lecture qu’on utilise pour structurer un plan d’action.

Les 3 leviers en un coup d'œil

Tableau

Levier	Ce que c'est	Exemples d'actions
Owned Media	Ce qu'on produit et contrôle directement	Contenus longs, silos sémantiques, FAQ, données structurées, QBST
Earned Media	Ce que les autres disent de nous	Netlinking ciblé LLM, RP, Reddit, YouTube, mentions tierces
Technique	Ce qui permet aux LLMs d'accéder au site	Crawlabilité bots IA, robots.txt, performances, balisage

Ces trois leviers ne sont pas indépendants. Un contenu Owned parfaitement optimisé mais inaccessible aux crawlers LLM (problème Technique) ne sera jamais cité. Une marque qui génère de l’Earned Media mais dont le site est mal structuré n’ancre pas sa légitimité. Les trois doivent avancer ensemble.

Dans ce guide, le levier Technique est traité dans la phase de Diagnostic (section 1.1 : vérification de l’accessibilité du site aux robots IA) et dans la section sur les données structurées (2.4). Les étapes 2 et 3 se concentrent sur l’Owned et l’Earned Media, qui représentent l’essentiel du travail une fois le socle technique en place.

La boucle Définir → Déployer → Piloter

La méthodologie Empirik suit trois étapes itératives. On ne déploie pas d’actions sans avoir défini un état des lieux. On ne pilote pas sans avoir déployé. Et le pilotage alimente systématiquement le cycle suivant.

Les 3 étapes en détail

① Définir
État des lieux de la visibilité LLM actuelle. Accessibilité technique aux crawlers. Construction du panel de prompts. Benchmark concurrents. Identification des sources citées sur la thématique. Croisement avec les performances SEO et l’exposition AIO.

② Déployer
Actions sur les 3 leviers en parallèle : optimisations Owned Media (contenus, structure, balisage), Earned Media (netlinking LLM, Reddit, YouTube, RP), Technique (crawlabilité bots, robots.txt, données structurées).

③ Piloter
Suivi continu via le LLM Brand Tracker (outil Empirik maison de suivi des mentions) + Analytics. Lecture croisée GEO / SEO / business (taux de citation, trafic organique, conversions). Alimentation du cycle suivant.

Source : Empirik – Méthodologie GEO

La boucle tourne en continu. En pratique, on recommande un cycle mensuel pour le benchmark LLM et un suivi hebdomadaire pour le SEO/Analytics (on y reviendra en section 6).

GEO et SEO : mêmes fondations, règles du jeu différentes

On nous pose souvent la question : “Est-ce que le GEO, c’est juste du SEO avec un autre nom ?” Non, mais ce n’est pas non plus une discipline séparée. Les bases sont identiques, les contenus produits sont les mêmes. Ce qui change, c’est la façon dont les résultats sont sélectionnés, les indicateurs à suivre et les outils à utiliser. Voilà comment les différencier sans les opposer.

Ce qui est commun : fournir la réponse la plus pertinente à l’utilisateur, en s’appuyant sur les mêmes piliers (technique, contenu, autorité). Il est d’ailleurs impossible d’optimiser un site différemment pour le SEO et pour le GEO : on ne peut pas produire deux versions d’un même contenu, une pour Google, une pour ChatGPT.

Ce qui diffère : Google classe des pages web. ChatGPT ou Gemini, eux, construisent une réponse en citant des sources qu’ils jugent fiables. Ce n’est pas tout à fait la même logique.

SEO vs GEO : les différences clés

Tableau

	SEO	GEO
Mécanisme	Classement de pages	Construction d'une réponse avec citation de sources
Format du résultat	Liste de liens cliquables	Réponse synthétique (parfois avec sources)
Signal d'autorité	Backlinks, E-E-A-T, ancienneté du domaine	Mentions sur sources tierces citées par les LLMs, cohérence sémantique
KPI principal	Position, trafic organique, CTR	Taux de citation, citation reach, part de voix LLM
Outil de mesure	Google Search Console, SEMrush…	LLM Brand Tracker, AEO Grader
Cycle de résultats	Semaines à mois	Mois, opacité totale sur les volumes

Ce tableau appelle une nuance importante : le SEO reste un prérequis au GEO. Les études montrent qu’une page qui ranke en position 1 sur Google a 3,5 fois plus de chances d’être citée par ChatGPT qu’une page hors top 20. Autrement dit, un site SEO fort part avec une longueur d’avance en GEO mais ça ne suffit pas.

"Among pages ranking #1 in Google, 43.2% were cited by ChatGPT, 3.5x higher than the citation rate for pages ranking beyond Google's top 20."

— Kevin Indig - The science of how AI picks its sources, Growth Memo, mars 2026

À retenir :
Le SEO est nécessaire mais pas suffisant. ChatGPT récupère environ 6 fois plus de pages qu'il n'en cite, 85% des pages récupérées ne sont jamais citées dans les réponses finales. Être bien ranké ouvre la porte, mais ça ne garantit pas d'entrer.

Source : Kevin Indig, mars 2026

Etape 1 : Diagnostic & Audit GEO

Avant de toucher quoi que ce soit, il faut savoir où on en est. Un audit GEO, c’est 4 questions dans l’ordre :

Les LLMs peuvent-ils accéder au site ?
La ou les thématiques du site sont-elles exposées aux AI Overviews ?
Où est la marque dans les réponses LLM vs ses concurrents ?
Quelles pages SEO sont les plus menacées ?

1.1 - Vérifier l'accessibilité technique aux bots LLM

C’est le point de départ absolu, et c’est souvent là qu’on trouve les premières quick wins. Avant qu’un LLM puisse citer une source, il faut qu’il ait pu la lire. Or, beaucoup de sites bloquent involontairement (ou volontairement) les crawlers des LLMs dans leur robots.txt.

Les bots concernés : GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot, GoogleBot (pour les AI Overviews), Gemini (Google).

À retenir :
Un site qui bloque GPTBot ne peut pas être cité par ChatGPT, peu importe la qualité de ses contenus. C'est un frein technique total à identifier en 30 secondes dès la phase de prospection.

1.2 - Mesurer l'exposition de la thématique aux AI Overviews

Tous les secteurs ne sont pas égaux face aux AI Overviews. Une thématique très transactionnelle (ex. “acheter chaussures running”) est moins exposée qu’une thématique informationnelle (ex. “comment choisir ses chaussures de running”). Avant de construire un plan d’action, il faut objectiver cette exposition.

1.3 - Premier diagnostic rapide avec l'AEO Grader

Avant d’utiliser un outil de suivi des mentions comme le LLM Brand Tracker, l’AEO Grader de HubSpot permet de générer un rapport de visibilité LLM en quelques minutes gratuitement. C’est l’outil d’entrée en matière idéal en avant-vente : concret, visuel, et souvent révélateur pour une marque qui ne mesure pas encore l’enjeu.

Les 5 dimensions du rapport AEO Grader

Tableau

Dimension	Ce qu'elle mesure
Brand Recognition	Visibilité de la marque sur les canaux digitaux. Score de reconnaissance, profondeur des mentions, qualité des sources
Market Competition	Part de voix dans les conversations du secteur vs concurrents. Nombre de mentions, contextes de comparaison
Presence Quality	Qualité et cohérence de la présence en ligne : structure, contenu, données disponibles
Brand Sentiment	Tonalité des réponses IA sur la marque. Score général + contextuel + polarisation des sources
Share of Voice	Part de voix directe dans les réponses LLM sur les requêtes du secteur

Nuance sur la fiabilité : l’AEO Grader est un outil d’entrée en matière, pas un instrument de mesure précis. Les scores peuvent varier d’une génération à l’autre et les données sous-jacentes ne sont pas toujours vérifiables. On l’utilise pour ouvrir la conversation, pas pour piloter une stratégie.

1.4 - Benchmarker en continu avec le LLM Brand Tracker

C’est l’outil central du dispositif GEO Empirik. Là où l’AEO Grader donne une photo, le LLM Brand Tracker donne un film.

Le principe : on définit un panel de prompts représentatifs de la thématique et des personas. L’outil les interroge tous les jours sur ChatGPT et Gemini, et retourne pour chacun : est-ce que la marque est citée ? Quelles sources ont été utilisées pour construire la réponse ? Est-ce que le prompt a déclenché une recherche web ?

Limitation connue : les query fan-out (questions dérivées que les LLMs génèrent autour d’une thématique) ne sont plus récupérables sur les modèles GPT récents. Ils restent accessibles sur Gemini et les anciens modèles OpenAI. C’est une régression récente, à surveiller.

1.5 - Identifier les pages SEO exposées et prioriser le CRO

La dernière étape du diagnostic consiste à croiser les données SEO avec l’exposition AIO.

L’objectif : identifier les pages qui vont perdre du trafic et décider lesquelles méritent un effort CRO pour compenser.

La logique est simple : moins de clics entrants = chaque visite doit davantage convertir.

Une page à fort trafic organique sur des requêtes très exposées aux AIO est une priorité CRO immédiate.

Etape 2 : Optimisation GEO Owned Media : techniques, structure, contenus, etc

À retenir :

Le format dépend de l’intention (info / commercial)
Les listicles marchent surtout en tiers, pas en auto-promo
Forums / discussions = poids réel

L’Owned Media, c’est ce qu’on contrôle directement : les contenus du site, leur structure, leur balisage.

C’est le levier sur lequel on a le plus de prise et aussi celui qui demande le plus de rigueur, parce que les LLMs ne lisent pas un site comme Google le fait.

2.1 - Produire les bons formats pour les bonnes intentions

La première question à se poser avant de créer ou d’optimiser un contenu GEO : quelle est l’intention de recherche derrière les prompts qu’on cible ?

Ce n’est pas le secteur de l’entreprise qui détermine le format idéal, c’est ce que l’utilisateur cherche à accomplir.

Format de contenu × intention de recherche

Source : Wix AI Search Lab – The content types most cited by LLMs – analyse de 75 000 réponses IA, 1 056 727 citations

Quelques points contre-intuitifs à retenir :

Les listicles ne sont pas morts à condition qu’ils soient tiers. En professional services, 80,9% des listicles cités dans les LLMs proviennent de sites tiers neutres, pas de la marque elle-même.
Créer un listicle auto-promotionnel où on se met en n°1 est peu efficace. En revanche, être référencé dans les listicles des autres est un levier Earned Media majeur.
Les discussions (forums, Reddit) pèsent plus lourd qu’on ne le croit en contexte commercial, 11% des citations sur les requêtes commerciales. On y reviendra.

Source : Wix AI Search Lab

2.2 - Longueur et structure : ce que les LLMs lisent vraiment

À retenir :

< 1000 mots = mort
Les LLM lisent surtout le début (10–20%)
Une page multi-intent > pages mono-intent

La règle des 10 000 mots

La longueur corrèle significativement avec le taux de citation mais avec des nuances importantes selon le secteur.

Source : Kevin Indig — The science of how AI picks its sources

Longueur cible selon le secteur

Tableau

Secteur	Longueur optimale	Logique
Éducation, Crypto, SaaS technique	10 000 mots+	La profondeur = signal d'autorité
Finance	5 000 – 10 000 mots	Les pages trop longues diluent les données clés
Healthcare	2 000 – 5 000 mots	Trop de détail clinique nuit à la citation
CRM / RH	Structure > longueur	Format et balisage comptent plus que le nombre de mots

Source : Kevin Indig — The science of how AI picks its sources

À retenir :
La règle universelle : les pages de moins de 1 000 mots sous-performent dans tous les secteurs sans exception. Le contenu thin n'a pas de place dans une stratégie GEO.

Où les LLMs lisent dans une page

Les LLMs ne lisent pas une page de façon linéaire de haut en bas. Ils prêtent une attention disproportionnée à certaines zones.

Répartition de l'attention des LLMs dans une page

Tableau

Zone de la page	Niveau d'attention	Ce que ça implique
0 – 10% (intro, nav)	Faible	Les LLMs sautent les intros génériques
10 – 20% (début du contenu)	⭐⭐⭐ Maximum	Mettre les informations clés tôt
20 – 60% (corps)	Moyen à bon	Maintenir la densité informationnelle
60 – 90% (fin de corps)	Décroissant
90 – 100% (conclusion, footer)	Quasi nul	Les conclusions sont invisibles aux LLMs

Source : Kevin Indig — The science of how AI picks its sources

"The bottom 10% of any page earns 2.4 - 4.4% of citations, roughly a quarter of what the peak band earns. The conclusion section is nearly invisible to AI, regardless of vertical."

— Kevin Indig - Growth Memo, mars 2026

En pratique : ne pas enterrer les informations stratégiques dans une conclusion.

Mettre les définitions clés, les données chiffrées et les positions de la marque dans le premier tiers du contenu.

Les intros de 3 paragraphes qui “posent le contexte” sans rien dire sont à proscrire.

La page evergreen multi-intent : le Saint Graal

L’analyse de 21 000+ citations ChatGPT révèle un pattern systématique : les pages citées sur 10+ prompts distincts sont toutes des guides de catégorie à couverture large (format “best X 2026”, qui répond en une seule URL aux questions “qu’est-ce que c’est”, “comment choisir”, “quels sont les meilleurs”, “combien ça coûte”).

La raison mécanique à ça, c’est le RRF (Reciprocal Rank Fusion).

Quand un LLM opère par query fan-out, il lance plusieurs sous-requêtes en parallèle et fusionne les résultats via RRF : une page qui remonte sur plusieurs sous-requêtes se voit attribuer un score agrégé bien supérieur à une page qui n’apparaît que sur une seule.

Une page evergreen qui couvre 5 angles d’une thématique sera donc systématiquement remontée plus haut dans la synthèse finale qu’une page mono-intent même si cette dernière est “meilleure” sur sa requête spécifique.

Une seule page evergreen bien construite vaut plus que 10 pages mono-intent.

Le ROI du contenu GEO est front-loadé : une page bien structurée continue de cumuler de la citation reach dans la durée, là où une page trop spécialisée n’apparaît que sur une poignée de requêtes.

Source : Kevin Indig

Transformez les réponses IA en valeur business

2.3 - Création de nouveaux contenus en silos GEO

Les LLMs ne répondent pas à une requête isolée.

Ils opèrent par query fan-out : à partir d’une question principale, ils génèrent une série de sous-questions pour construire une réponse complète.

Une marque qui ne couvre que l’angle principal d’une thématique sera absente de la plupart des réponses construites autour de cette thématique.

Exemple : sur le prompt “meilleure agence SEO à Lyon”, un LLM va typiquement chercher :

“qu’est-ce qui différencie une bonne agence SEO”
“quels sont les critères de sélection”
“quelles agences SEO sont reconnues en France”
“avis clients agences SEO Lyon”
etc.

Si on n’est présent que sur la requête principale, on rate tous les angles dérivés.

Cette architecture de contenu est issue du livre blanc GEO de Frédéric Jezegou (Source : Rankit – Livre blanc GEO GreenRed 2026), testée lors d’un exercice grandeur nature appelé “concours GEO” durant lequel plusieurs équipes ont optimisé un site réel sur un panel de requêtes pendant 10 semaines. Le dispositif X+1 a généré 94 citations en 10 jours. Voici comment le mettre en place.

À retenir :

Un dispositif compact : X pages exact match (1 par prompt) + 1 page FAQ pivot + 1 page FAQ pivot version EN
Règle centrale : title = H1 = slug = prompt mot pour mot sur les X pages
La page FAQ agrégatrice EN est le levier le plus rentable observé (94 citations en 10 jours sur le concours)
Cohérence factuelle stricte sur les X+1 pages : une divergence fait sortir du panorama Claude

La stratégie du "X +1" :

① Choix du domaine
Si le domaine n’est pas encore arrêté : privilégier un nom de domaine avec historique et autorité déjà installée. Un domaine neuf démarre avec un handicap sur la fenêtre de 8 à 10 semaines du dispositif.

② Production des X pages exact match
Une page par prompt cible. Règle stricte : title = H1 = slug = prompt mot pour mot. Aucune reformulation dans ces trois éléments. Les H2 internes, la meta description et le corps du contenu peuvent (et doivent) être reformulés. URL sur un chemin court et propre, pas enterrée à 3 niveaux.

③ Production de LA page guide-FAQ agrégatrice
Créer une URL unique qui reprend les 10 prompts au format FAQ. Chaque question en H2 reproduit le prompt mot pour mot. Balisage FAQPage JSON-LD obligatoire avec les X Q/R. Contenu dense, pas un simple résumé des 10 pages. C’est la page pivot éditoriale du dispositif : le guide ultime.

④ Maillage croisé
Depuis chaque page exact match : liens contextuels vers la page FAQ pivot + 3 à 5 pages sœurs pertinentes.
Depuis la page FAQ pivot : lien explicite vers chacune des X pages exact match en fin de réponse de chaque bloc FAQ.

⑤ Cohérence factuelle stricte
Tous les chiffres clés, dates, noms d’entités doivent être identiques sur les X+1 pages (X exact match + 1 page agrégatrice). Une divergence même minime fait sortir la source du panorama Claude.

En pratique :

Établir une fiche factuelle maître en amont
Rédiger toutes les pages à partir de cette fiche
Appliquer la même logique au JSON-LD

⑥ Dupliquer et traduire la page agrégatrice en anglais
Une seule page, en anglais intégral, avec un mot d’autorité explicite dans l’URL et le title (official site, complete guide, etc.). Positionnement pivot et non satellite : elle ne cible aucun prompt spécifique mais résume l’offre.

hreflang="en" + lien réciproque depuis la home FR
Ciblage Claude et Mistral principalement
Levier le plus rentable observé sur le concours (94 citations en 10 jours)

⑦ Pattern d’autorité
À déployer uniquement si la substance existe réellement côté client. Éléments à installer sur chaque page :

Entité nommée clairement
Experts identifiés avec titres vérifiables
Protocoles ou méthodes codés (nom propre)
Indices propriétaires
Chiffres précis répétés à l’identique sur chaque page

C’est ce qui déclenche les citations sur Mistral et Claude.

2.4 - Données structurées (JSON-LD)

Le JSON-LD seul a un effet marginal sur les citations LLM. Ce qui compte vraiment, c’est que les informations clés soient lisibles et navigables dans le HTML visible. Le markup ne fait que redire ce qui doit déjà être dans le texte.

On l’implémente quand même : ça ne nuit jamais, Bing/Copilot l’utilisent officiellement, et FAQPage + HowTo restent les formats les plus extractables.

Les données structurées ont un impact sur le GEO mais bien plus indirect et conditionnel que ce qu’on lit souvent dans les articles SEO.

Avant de baliser frénétiquement tout un site, voilà ce que la recherche dit réellement.

Ce qui est établi : un effet modeste seul, fort en combinaison

L’étude contrôlée la plus solide disponible à date (Volpini, Raad, Gamba, Riccitelli, préprint 2026, testé sur 4 secteurs, ~2 439 évaluations) montre que l’ajout de JSON-LD seul sur du HTML n’apporte qu’un gain marginal (Δ ≈ +0,27 sur une échelle de 1 à 5).

En revanche, les pages entités “enhanced” avec liens matérialisés vers d’autres entités, breadcrumbs structurés, sections Q&A navigables apportent un gain de +29 à 30% en précision dans ces mêmes pipelines.

Cette étude est signée par l’équipe de WordLift, qui vend des outils d’optimisation de pages pour agents IA. Conflit d’intérêts réel sur les conclusions positives de l’étude. En revanche, le résultat négatif sur le JSON-LD seul (+0,27) est peu contestable : Volpini n’avait aucune raison de le minimiser artificiellement. (Source : Volpini et al., arXiv 2603.10700)

L’explication technique est simple : si un LLM ingère une page “comme du texte aplati”, le JSON-LD embarqué dans le <script> peut être ignoré ou dilué dans l’embedding. Le markup ne sert que si le système d’indexation l’extrait et l’indexe comme structure séparée. Ce n’est pas garanti sur ChatGPT, Gemini ou Perplexity, ces systèmes sont des boîtes noires.

Ce qui est suggéré mais non prouvé :

Un test industriel (Nogami & Tannenbaum, Search Engine Land, 2025) sur 3 pages quasi identiques montre que seule la page avec un schema de bonne qualité est apparue dans les AI Overviews mais les auteurs eux-mêmes qualifient le résultat de “prometteur mais non conclusif” (N=3, variables confondantes). (Source : Search Engine Land)

Microsoft affirme officiellement que le schema markup aide ses systèmes Bing/Copilot à comprendre et parser le contenu. (Source : Microsoft Advertising Blog)

La documentation Google Search Central confirme l’usage des données structurées pour comprendre le contenu et activer des rich results, mais ne précise nulle part leur impact sur la sélection des sources dans les AI Overviews. (Source : Google Search Central)

Ce qui n’est pas prouvé du tout :

La causalité “ajouter du JSON-LD = être plus cité par ChatGPT” n’est démontrée par aucune source primaire accessible.

La documentation officielle d’OpenAI décrit le mécanisme de citation (via outils web_search et file_search) sans mentionner le JSON-LD comme signal favorisant la sélection. (Source : OpenAI API Docs)

En clair : les chiffres “+28% pour FAQPage” et “+24% pour HowTo” qu’on trouve dans certains articles SEO proviennent d’une étude Relixir dont la méthodologie n’est pas reproductible. Ne pas les citer comme vérités établies en avant-vente.

Ce qu’on fait quand même, et pourquoi :

Malgré ces nuances, on continue à implémenter les données structurées pour deux raisons valides :

Premièrement, l’effet est conditionnel mais réel dans les pipelines qui extraient correctement le JSON-LD (et c’est le cas de certains systèmes de Bing/Copilot selon leur documentation), le balisage aide à la compréhension et au parsing. C’est un signal de qualité qui ne nuit jamais.

Deuxièmement, l’approche la plus robuste n’est pas “baliser et espérer”, c’est rendre les informations entités visibles et navigables dans le contenu lui-même.

Une page où les faits clés (adresse, horaires, définitions, Q&A) sont présentés clairement dans le HTML visible sera extractable par un LLM même si celui-ci ignore complètement le JSON-LD.

Le balisage ne fait que redondance avec ce qui doit déjà être dans le texte.

Priorités d'implémentation (dans cet ordre)

Les types prioritaires dépendent de la nature du site.

Pour un site de services ou éditorial : FAQPage, HowTo, Article et Organization sont les plus utiles.

Pour un commerce physique ou multi-établissements, LocalBusiness et GeoCoordinates sont essentiels. Ils permettent aux moteurs IA d’associer précisément une adresse et des horaires à la marque.

Pour un site e-commerce, Product facilite la lecture des fiches produit par les IA.

Tableau

Type	Cas d'usage	Pourquoi
FAQPage	Pages avec section FAQ	Aligne le contenu avec les requêtes conversationnelles, l'effet passe autant par le format visible que par le markup
HowTo	Contenus step-by-step	Structure extractable par les LLMs
Article + dateModified	Articles de blog	Signal de fraîcheur, renforce le freshness bias (section 4.6)
Organization	Homepage	Aide les LLMs à identifier et attribuer correctement la marque
LocalBusiness + GeoCoordinates	Retail/ Réseau de franchises	Critique pour le local : adresse, horaires, coordonnées exactes (Source : Google - LocalBusiness)
Product	E-commerce	Facilite l'extraction des attributs produit

Règle d’or :
le JSON-LD doit toujours refléter fidèlement le contenu visible de la page. Baliser des informations non présentes dans le HTML est une violation des guidelines Google et contre-productif en GEO puisque le LLM ne trouvera pas dans le texte ce que le markup lui promet. (Source : Google SD Policies)

Sources :
Volpini et al. — JSON-LD vs Entity Pages in RAG (arXiv 2603.10700)
Nogami & Tannenbaum — Schema & AI Overviews (Search Engine Land, 2025)
Microsoft — Optimizing content for AI Search Answers
Microsoft — Bing/Copilot use schema for LLMs (Search Engine Land)
Google Search Central — Structured Data
Google Search Central — LocalBusiness
OpenAI — Citation Formatting

2.5 - Production avec Thot SEO

À retenir :

Les LLM attendent un champ lexical précis
Décrire ≠ nommer → il faut les bons termes

L’optimisation QBST (Query Based Salient Terms) consiste à identifier les termes saillants qu’un système automatisé associe à une requête donnée pour évaluer la pertinence et l’autorité d’une page sur un sujet.

Ce n’est pas du keyword stuffing, c’est de l’alignement sémantique : s’assurer que le contenu contient les termes que le modèle “attend” pour considérer la page comme une source fiable sur cette thématique.

Un exemple concret vaut mieux qu’une définition :

Texte non optimisé :“Je suis une petite bête verte un peu gluante, je fais des grands sauts de nénuphar en nénuphar et je mange des moustiques.“ → Un robot ne reconnaît pas le sujet. Pas de grenouille. ❌

Texte optimisé :“Je fais partie de la famille des batraciens et je suis également un anoure.“ → Le robot reconnaît immédiatement le sujet. ✅

Ce qui a changé : le second texte utilise les termes du champ lexical attendu, les mots que les modèles associent mathématiquement à ce sujet.

Le premier texte décrit la grenouille sans jamais utiliser les termes qui permettent à un robot de l’identifier.

Ce score d’alignement sémantique est calculable sous forme de pourcentage : c’est le score sémantique.

C’est Thot SEO (outil acquis par Empirik) qui permet d’identifier ces termes saillants pour une requête cible, de calculer le score sémantique d’une page existante, et de guider la rédaction en conséquence.

L’outil permet de travailler le champ sémantique, la densité QBST et la structure des contenus sans multiplier les outils ou les allers-retours ainsi qu’optimiser simultanément pour Google et pour les LLMs sans produire deux versions d’un même contenu.

2.6 - Le biais de fraîcheur (freshness bias)

À retenir :

Les contenus récents sont favorisés
Le signal doit être dans le texte, pas juste en meta

👉 Quick wins

“Mis à jour en 2026”
Ajouter des exemples récents

C’est probablement le conseil le plus simple à appliquer dans ce guide mais attention : il ne fonctionne que si la mise à jour du contenu est réelle. Un simple changement de date sans fond éditorial peut rapidement se retourner contre vous.

Les LLMs embarquent un biais de fraîcheur : à contenu égal, ils favorisent systématiquement les sources récentes lors de l’étape de reranking. Ce biais a été confirmé simultanément par un chercheur indépendant dans le code de production de ChatGPT, et par une étude académique.

La preuve dans le code : dans les fichiers de configuration de ChatGPT, le paramètre use_freshness_scoring_profile: true confirme qu’OpenAI applique un scoring de fraîcheur systématique pour favoriser les contenus récents lors du reranking.

La preuve en laboratoire : une équipe de l’Université Waseda a testé 7 modèles (GPT-3.5, GPT-4o, GPT-4, LLaMA-3 8B/70B, Qwen-2.5 7B/72B) en injectant des dates de publication artificielles sur des passages identiques.

Résultat : les passages “frais” sont systématiquement promus, déplaçant certains résultats jusqu’à 95 rangs. La préférence entre deux passages de qualité identique peut être inversée dans 25% des cas après injection d’une date récente.

Point technique important : le freshness bias n’apparaît pas au niveau des query fan-out. Il se manifeste exclusivement lors du reranking, quand le LLM reçoit des documents comportant une date explicite dans le texte. Ce qui signifie que le signal temporel doit être visible dans le contenu lui-même pas seulement dans les métadonnées.

Et les chiffres terrain confirment : 65% des hits de crawlers IA ciblent du contenu publié dans l’année en cours, et 79% du contenu des deux dernières années.

Ce que ça implique en pratique

Tableau

Action	Impact	Priorité
Ajouter un signal temporel explicite dans le texte	Très fort	⭐⭐⭐
Mettre à jour les pages piliers avec exemples/chiffres récents	Fort	⭐⭐⭐
Ajouter `dateModified` dans le schema Article	Moyen	⭐⭐
Mentionner l'année dans title et meta description	Moyen	⭐⭐
Créer du contenu réactif sur des tendances sectorielles	Variable	⭐

Concrètement : ajouter des formulations comme “Mis à jour en mars 2026” ou “Données vérifiées en 2026” directement dans le corps du texte est littéralement l’un des signaux les plus valorisés par les LLMs lors du reranking. C’est 30 secondes de travail sur une page existante.

La nuance à avoir : les chercheurs avertissent d’une possible “course aux armements temporelle”, les éditeurs peuvent gonfler leurs rankings avec de faux labels “mis à jour en 2026”, ce qui pourrait pousser les LLMs à détecter et pénaliser les mises à jour superficielles.

La mise à jour doit donc être réelle : nouveaux exemples, chiffres réactualisés, captures d’écran fraîches. Une mise à jour cosmétique de la date sans fond n’est pas une stratégie durable.

Sources :
Metehan Yesilyurt — I Found It in the Code, Science Proved It in the Lab
Waseda University — Do LLMs Favor Recent Content? (arXiv 2509.11353)
Search Engine Land — Researchers fooled AI models with fake dates
Seer Interactive — AI Brand Visibility and Content Recency

2.7 - Exemple de règles de rédaction adaptées à l’IA

À retenir :

Les LLMs extraient des fragments, pas des pages entières
Chaque phrase doit être autonome et compréhensible hors contexte
Le signal doit être dans le texte, pas seulement dans les balises

👉 Quick wins

Remplacer les pronoms vagues ("il", "cela") par l'entité nommée
Ouvrir chaque section par une affirmation de 40-60 mots
Viser moins de 5 000 caractères par section thématique

Source : How to write for AI search: A playbook for machine-readable content

Résumé de l'article

Le GEO copywriting repose sur un principe fondamental : les LLMs ne lisent pas une page de haut en bas. Ils la découpent en fragments indépendants et n’en retiennent qu’une fraction.

Écrire pour les moteurs IA signifie structurer le langage lui-même, pas seulement le balisage autour.

Le grounding budget : Google Gemini opère sur un budget de récupération d’environ 1 900 mots par requête, répartis sur plusieurs sources.

Chaque page individuelle se voit allouer environ 380 mots. La concision et la densité ne sont pas un choix stylistique, elles sont une contrainte technique.

Le triplet sémantique : une phrase GEO-friendly doit contenir trois éléments : une entité nommée explicitement (sujet), un verbe de relation précis (prédicat), et une donnée vérifiable assortie d’une condition (objet).

Ce schéma [Entité] + [Relation] + [Donnée + Condition] est directement extractable par un LLM sans inférence.

Point technique important : Google utilise des embeddings vectoriels au niveau du passage. Un titre H2/H3 placé au-dessus d’un paragraphe améliore la similarité cosinus (pertinence mathématique) de ce passage de jusqu’à 17,54 %. Les titres ne sont pas que des éléments de navigation, ce sont des ancres sémantiques.

Les chiffres terrain confirment l’impact de la densité sur l’extraction : les pages de moins de 5 000 caractères voient 66 % de leur contenu utilisé par les IA, contre seulement 12 % pour les pages dépassant 20 000 caractères.

Ce que cela implique en pratique

🔴 Priorité haute

Nommer explicitement l’entité dans chaque phrase → élimine les erreurs d’inférence du LLM
Ouvrir chaque section par une affirmation dense de 40-60 mots → maximise l’extraction en début de passage
Remplacer tout adjectif vague par une donnée chiffrée → passe le filtre de densité informationnelle

🟠 Priorité moyenne

Réduire les sections à moins de 5 000 caractères → améliore le taux d’extraction (66 % vs 12 %)
Titres H2/H3 contenant l’entité principale + l’intention → +17,54 % de similarité cosinus

🟡 Maintenance

Test d’isolation : lire une phrase au hasard hors contexte → détecte les dépendances cachées

Etape 3 : Optimisation GEO Earned Media : RP, YouTube, Reddit, lining

L’Earned Media, c’est tout ce qu’on ne contrôle pas directement : les mentions sur des sites tiers, les discussions sur les forums, les vidéos YouTube qui citent une marque, les articles de presse, les comparatifs. C’est pourtant là que se joue une grande partie de la visibilité GEO, parce que les LLMs ne se fient pas uniquement au site d’une marque pour la citer. Ils s’appuient sur ce que le reste du web dit à son sujet.

3.1 - YouTube : la source n°1 des AI Overviews

À retenir :

Source n°1 des AIO (~30%)
Les transcriptions = données LLM

👉 Stratégie

Créer du contenu
OU être mentionné par des créateurs

C’est le chiffre qui surprend le plus : YouTube est le domaine le plus cité dans les AI Overviews de Google, devant tous les sites d’experts, tous les médias, toutes les marques.

YouTube dans les AI Overviews

29,5% des AI Overviews de Google citent YouTube comme 1ère source toutes catégories confondues
GPT-4 a été entraîné sur plus d’1 million d’heures de transcriptions YouTube (New York Times)
Les LLMs ne pouvant pas diffuser de vidéo, ils préfèrent naturellement citer YouTube quand le prompt le demande

Sources : Ahrefs — How to rank on ChatGPT

Il y a deux raisons à cette domination :

YouTube est une source massive de données d’entraînement pour les LLMs. Une mention dans une transcription vidéo devient un signal dans le modèle lui-même.
Les LLMs incapables de restituer du contenu vidéo directement orientent vers YouTube quand une réponse visuelle serait plus adaptée.

Deux stratégies complémentaires :

Créer sa propre chaîne. Publier régulièrement des vidéos sur les thématiques stratégiques. Les transcriptions auto-générées par YouTube sont indexables par les LLMs, chaque vidéo est potentiellement une nouvelle source citeable. Optimiser les titres, descriptions et chapitres pour les requêtes cibles.

Obtenir des mentions sur des chaînes tierces. C’est souvent plus rapide et plus impactant. Un créateur avec 50 000 abonnés qui mentionne une marque dans une vidéo populaire génère des signaux d’entraînement bien plus puissants qu’une chaîne de marque démarrée de zéro. Formats possibles : sponsoring, review produit, interview, guest appearance.

🛠️ Outil : YouTube Channel Exporter

Notre outil Youtube Channel Exporter exporte toutes les statistiques disponibles d’une chaîne YouTube en un clic : vues, formats, rythme de publication, thématiques.

Lancer sur la chaîne de la marque + chaînes concurrentes → envoyer les données dans Claude avec le bon prompt → audit stratégique complet en quelques minutes.

3.2 - Reddit : s'insérer dans les discussions que les LLMs lisent

À retenir :

Source clé pour les LLM (authenticité)
Nécessite temps + crédibilité

👉 Règles

Warm-up obligatoire
Pas de spam
Valeur avant promo

Reddit reste l’une des sources les plus consultées par les LLMs dans de nombreux secteurs, notamment parce que ses discussions sont perçues comme authentiques, non commerciales, et riches en langage naturel conversationnel. Exactement le type de contenu sur lequel les LLMs ont été massivement entraînés.

Sources : Ahrefs — How to rank on ChatGPT

La stratégie Reddit demande de la patience et de la subtilité. Il ne s’agit pas de spam, les modérateurs et les algorithmes de Reddit sont rodés à détecter la promotion déguisée, et une marque grillée sur Reddit l’est pour longtemps.

Le plus simple consiste à passer par Whitepress qui a un service dédié à Reddit :

Mais il est possible de le faire directement sans passer par un service tiers. Dans ce cas, il est important d’avoir une vraie activité dans Reddit, de construire sa crédibilité avant de mentionner une marque.

SETUP (à faire une seule fois) :

Checklist Reddit

L'objectif de cette phase : cartographier le terrain avant d'y poser un pied.

Créer un vrai compte Reddit, pas un compte jetable. Reddit est une stratégie long terme, pas un raccourci vers ChatGPT.

Rechercher [topic] site:reddit.com et [money keyword] site:reddit.com sur Google pour identifier les threads qui rankent déjà.

🛠️ Outil : Reddit FAQ Finder

Reddit FAQ Finder identifie rapidement les meilleurs subreddits et les questions les plus posées sur une thématique. Double usage : alimenter le panel de prompts du LLM Brand Tracker, ou repérer les threads sur lesquels prendre la parole.

Checklist Reddit

Compléter avec Ahrefs/Semrush sur reddit.com filtré par thématique, et avec les sources issues du LLM Brand Tracker. Ce sont les threads que les LLMs lisent effectivement.

Tout collecter dans un Google Sheet : URL du thread, subreddit, funnel depth (TOFU / MOFU / BOFU).

Lire les règles de chaque subreddit avant de toucher quoi que ce soit. Beaucoup interdisent les liens ou l'autopromotion. Si c'est flou, lurker quelques jours ou DM les mods.

Configurer des alertes F5bot / Brand24 / Octolens sur la marque, les concurrents et les catégories clés.

WARM-UP (2 à 4 semaines minimum)

Sans karma, un compte ne peut pas poster utilement, Reddit filtre ou shadow-ban les nouveaux comptes trop agressifs. Cette phase sert à construire la crédibilité avant de chercher à en tirer quoi que ce soit.

Checklist Reddit

Répondre à des threads existants sans promouvoir : être utile, expert, conversationnel.

Prioriser les threads déjà indexés par les LLMs sur les prompts ciblés. Une intervention sur ces threads a un impact potentiel immédiat sur la visibilité GEO.

Intégrer les bons mots-clés dans les commentaires : décrire le produit comme "un bon outil de [catégorie]" plutôt que d'utiliser des termes propriétaires. Les LLMs indexent le langage naturel, pas le jargon de marque.

CONTENT : Commenter ou créer ?

Une fois le compte warmé, l’objectif n’est pas de poster le plus souvent possible, c’est de poster au bon endroit, sur le bon angle, avec le bon niveau de promotion selon où se trouve l’utilisateur dans son parcours d’achat.

La première décision à prendre pour chaque thread identifié dans ton Google Sheet : est-ce qu’il vaut mieux intervenir sur l’existant ou en créer un nouveau ?

→ Commenter un thread existant est pertinent quand le thread remonte déjà dans les sources consultées par les LLMs. C’est le signal qu’il est lu par les modèles, et qu’une intervention dessus a un impact potentiel immédiat.

Condition : le thread doit être encore ouvert aux commentaires et la modération doit être tolérante. Si c’est le cas, contribuer réellement à la discussion d’abord, glisser la mention de la marque ensuite, jamais l’inverse.

→ Créer un nouveau thread est souvent la meilleure option sur les sujets où les threads existants sont fermés, trop anciens, ou insuffisamment complets. Le principe : traiter la même question de façon plus utile que ce qui existe déjà, sans mentionner la marque au lancement.

Laisser la discussion s’installer, répondre aux commentaires, construire de l’engagement. Quelques jours plus tard, éditer le post initial pour introduire la mention naturellement. A ce stade, le thread a de la vie et la mention passe comme une recommandation, pas comme de la pub.

Dans les deux cas, le niveau de promotion doit être indexé sur la profondeur de funnel du thread. Sur un thread BOFU “quelqu’un connaît un bon outil pour X ?”, une mention directe est attendue et légitime. Sur un thread TOFU ou MOFU, l’objectif est de construire de la crédibilité, pas de convertir. Une marque qui apparaît systématiquement dans les discussions utiles d’un subreddit installe une préférence bien plus efficacement qu’un commentaire qui se finit par un lien.

Trois points d’exécution pour tenir cette stratégie dans la durée :

Checklist Reddit

Mettre en place un calendrier éditorial : 1 post original par semaine minimum. Sans cadence, la présence Reddit s'effrite rapidement.

Utiliser les LLMs pour accélérer la production : coller une question Reddit dans ChatGPT avec le prompt "Comment un expert répondrait à ça de façon conversationnelle et utile ?" → personnaliser avant de poster.

Booster avec Reddit Ads uniquement les posts qui ont déjà généré de l'engagement organique. Ils ont été validés par la communauté, la promotion ne fait qu'amplifier.

MESURE & ITÉRATION

Pour suivre les retombées de nos actions :

Checklist Reddit

Suivre le trafic Reddit dans GA4 sous le canal referral sans UTM dans les liens postés (les Redditors détestent ça, c'est perçu comme du tracking commercial).

Requêter régulièrement les money keywords dans ChatGPT, Perplexity et Gemini : la marque apparaît dans les réponses ? C'est le signal que ça fonctionne.

Tracker les keyword rankings et impressions GSC sur les threads Reddit qui rankent sur Google.

Ajouter Reddit dans le formulaire "comment vous nous avez connus ?", le dark social Reddit est sous-estimé.

Chaque mois : identifier quels topics et formats génèrent le plus d'engagement → doubler dessus, abandonner ce qui ne prend pas.

Recycler les meilleurs commentaires en blog posts, FAQs et contenu onboarding. Si un angle plaît sur Reddit, il plaira ailleurs.

3.3 - Netlinking et RP ciblés LLM

À retenir :

On cible les sources utilisées par les LLM ,pas juste le DA
Un site de niche cité > gros média ignoré

Le netlinking GEO n’est pas le netlinking SEO. En SEO, on cherche des liens depuis des domaines à fort DA. En GEO, on cherche des mentions sur les sources que les LLMs consultent effectivement sur nos thématiques, ce qui n’est pas toujours la même chose.

Un backlink depuis un DA 80 généraliste ne vaut pas grand chose en GEO si les LLMs ne s’y réfèrent jamais. En revanche, une mention sur un site de niche à DA 35 qui est systématiquement cité par Perplexity sur les requêtes cibles est un levier GEO majeur.

La démarche concrète :

Lancer le LLM Brand Tracker sur les prompts stratégiques
Extraire les sources effectivement citées par les LLMs sur ces prompts
Construire le plan de netlinking/RP en ciblant prioritairement ces sources
Mesurer l’évolution du taux de citation après les actions

C’est une inversion complète de la logique SEO classique : on part des sources citées par les LLMs pour remonter vers les opportunités de liens, plutôt que de partir des métriques de domaine

3.4 - Les listicles et comparatifs tiers : être dans les listes

À retenir :

Très cités en requêtes commerciales
80% = sources tierces

Les listicles tiers (“Les meilleures agences SEO à Lyon”, “Top 10 des outils de gestion de projet”) sont l’un des formats les plus cités par les LLMs sur les requêtes commerciales (40,86% des citations selon l’étude Wix).

Mais attention à la nuance : ce sont les listicles tiers et neutres qui performent, pas les listicles auto-promotionnels.

Listicles tiers vs auto-promotionnels en professional services

Tableau

Type	Part des citations listicles
Listicles tiers (site neutre)	80,9%
Listicles auto-promotionnels	19,1%

Source : Wix AI Search Lab

La stratégie : identifier les comparatifs, roundups et “best of” sectoriels qui remontent dans les réponses LLM sur les requêtes commerciales et travailler à y figurer via RP, outreach direct aux éditeurs, ou en fournissant des éléments différenciants (études, données, témoignages) qui justifient l’inclusio

À retenir :
Créer un listicle sur son propre site où on se met en n°1 est contre-productif en GEO. L'effort est bien mieux placé sur l'inclusion dans des listes tierces indépendantes.

3.5 - E-E-A-T et signaux d'autorité externe

À retenir :

Toujours clé
Les LLM favorisent :

experts identifiés
données originales
mentions médias

Les signaux E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) restent un prérequis en GEO comme en SEO. Les LLMs s’appuient sur les mêmes signaux de confiance que Google pour évaluer la fiabilité d’une source : présence de bios d’auteurs crédibles, citations de sources reconnues, cohérence des mentions sur le web, présence dans des médias de référence.

Quelques actions concrètes à fort impact :

Bios d’auteurs détaillées. Nom, titre, expertise, liens vers profils LinkedIn et publications. Un contenu attribué à un expert identifiable est plus citable qu’un contenu anonyme.
Données originales et études propriétaires. Les LLMs citent préférentiellement les sources qui produisent des données qu’on ne trouve nulle part ailleurs. Une entreprise qui publie une étude annuelle sur son secteur devient une source de référence incontournable.
Mentions dans des médias reconnus. Un article dans Les Echos, une interview dans un podcast sectoriel de référence, une citation dans une étude universitaire, ces mentions sont des signaux d’autorité que les LLMs intègrent dans leur évaluation de la fiabilité d’une marque.

Sources :
Ahrefs — How to rank on ChatGPT
Wix AI Search Lab — The content types most cited by LLMs
Firebrand — GEO Best Practices 2026

Etape 4 : Mesure des citations/mentions sur les LLMs & impact sur la performance digitale

Le GEO est une discipline encore opaque : pas de Search Console dédiée, pas de volumes de recherche officiels. Le pilotage se fait avec les outils qu’on a construits et les proxys qu’on a identifiés.

Part de voix et mentions dans les LLMs – LLM Brand Tracker
Le KPI central. Sur le panel de prompts défini en audit, on suit l’évolution du taux de citation par LLM (ChatGPT, Gemini, Perplexity), la part de voix vs concurrents, et les sources utilisées par les modèles sur nos thématiques.

Trafic et conversions depuis les LLMs – GA4 (ou Piano, Matomo…)
Même si le volume reste faible (< 1% du trafic total), c’est un indicateur de tendance à surveiller. Dans GA4, filtrer par source sur les user agents des LLMs connus (ChatGPT, Perplexity, etc.) pour isoler ce trafic et mesurer son évolution mois après mois.

Volume de recherche de marque – Ahrefs
Un proxy indirect mais fiable. Quand une marque est régulièrement citée dans les LLMs, les utilisateurs finissent par la rechercher nommément sur Google. Une hausse du branded search est souvent le premier signal mesurable d’une bonne visibilité GEO.

Apparitions dans les AI Overviews – Ahrefs
Sur les mots-clés suivis, Ahrefs permet d’identifier quelles requêtes déclenchent une AI Overview et si la marque y est citée. C’est le lien direct entre GEO et performance SEO/CTR et l’argument le plus concret à mettre dans un reporting.

Checklist pour définir et mettre en oeuvre une stratégie GEO

PHASE 1 - Avant de toucher quoi que ce soit : le diagnostic (J1 à J5)

1. Vérifier que les bots LLM peuvent crawler le site
Contrôler le robots.txt.Si GPTBot, ClaudeBot ou PerplexityBot sont bloqués dans le robots.txt → quick win immédiat, débloquer en priorité absolue avant toute autre action.

2. Mesurer l’exposition de la thématique aux AI Overviews
Estimer l’impact potentiel des résultats AI Overviews sur Google France via notre outil d’analyse d’impact AI Overviews sur les thématiques principales du site.

3. Générer un premier diagnostic de visibilité LLM
Lancer l’AEO Grader HubSpot sur la marque : scores par LLM, part de voix vs concurrents, axes d’amélioration.

4. Construire le panel de prompts
Lister 10 à 20 prompts couvrant notoriété, comparaison, informationnel et transactionnel. Utiliser le Reddit FAQ Finder pour identifier les vraies questions du secteur.

5. Configurer le LLM Brand Tracker
Configurer le panel et ajouter 3 à 5 concurrents directs. Identifier : la marque est-elle citée, sur quels LLMs, et surtout quelles sources sont utilisées (= cibles prioritaires Earned Media).

6. Identifier les pages exposées aux AI Overviews
Croiser GSC + Ahrefs : pages à fort trafic sur requêtes AIO = priorité CRO

PHASE 2 - Les actions Technique (Semaine 1-2)

7. Corriger les blocages de crawl LLM
Si des bots sont bloqués (trouvé en 1.) : modifier le robots.txt pour autoriser GPTBot, ClaudeBot, PerplexityBot, Gemini-bot.

8. Auditer et mettre en place les données structurées prioritaires
Dans cet ordre de priorité :

Implémenter FAQPage sur toutes les pages avec une section FAQ (aide les moteurs IA à lire le contenu comme une série de questions/réponses)
Implémenter HowTo sur les contenus step-by-step (structure directement lisible par les IA)
Article avec dateModified sur tous les articles de blog
Organization sur la homepage
Product sur les pages produit (e-commerce)

Valider avec le Rich Results Test de Google.

PHASE 3 - Les actions Owned Media (Semaine 2 à 8)

9. Auditer les contenus existants avec Thot SEO
Sur les pages stratégiques (pages piliers, articles à fort trafic) : lancer un audit QBST via Thot SEO. Identifier les pages avec un score sémantique insuffisant, ce sont les premières à optimiser.

10. Optimiser les contenus existants avant d’en créer de nouveaux
Dans l’ordre :

Corriger le score sémantique QBST des pages piliers (termes du champ lexical attendu manquants)
Ajouter un signal temporel explicite dans le corps du texte : “Mis à jour en mars 2026”, “Données vérifiées en 2026”
Mettre à jour les chiffres, exemples, captures d’écran : le freshness bias récompense les vraies mises à jour
S’assurer que les informations clés sont dans le premier tiers de la page (zone 10-20% = peak de lecture des LLMs)
Supprimer les intros inutiles qui repoussent le contenu vers le bas

11. Identifier les trous sémantiques et planifier les nouveaux contenus
Utiliser les fan-out queries identifiées dans le LLM Brand Tracker (disponibles sur Gemini) pour repérer les angles non couverts. Chaque fan-out query sans page dédiée est un trou dans la raquette GEO.

Prioriser les contenus evergreen multi-intent : une page qui répond à 5 angles d’une thématique (qu’est-ce que c’est / comment choisir / quels sont les meilleurs / combien ça coûte / avis) sera citée sur bien plus de prompts qu’une page mono-intent.

12. Créer les nouveaux contenus
Deux approches selon la nature du panel de prompts issu du diagnostic.

Approche A, panel large ou non arrêté (cas standard)

Production classique via Thot SEO pour garantir le score sémantique. Format cible selon l’intention :

Informationnel : article de fond 5 000 mots minimum, structuré en silos avec maillage vers les pages satellites
Commercial : listicle ou guide comparatif (à faire référencer par des tiers plutôt qu’en auto-promo)
Transactionnel : pages produit/catégorie optimisées
Local/Nav : homepage et pages profil soignées

Approche B, panel court et arrêté : dispositif X+1 exact match

Si une entreprise sait précisément sur quels prompts il veut être cité (liste arrêtée ≤ 15) et dispose d’une substance d’autorité réelle, déployer le dispositif X+1 exact match (section dédiée) plutôt que la production classique.

En résumé : X pages exact match (title = H1 = slug = prompt) + 1 page FAQ pivot agrégatrice + duplication EN de la page pivot + maillage croisé + cohérence factuelle stricte sur les 11 pages.

Production des pages toujours via Thot SEO pour le score sémantique.

PHASE 4 - Les actions Earned Media (Mois 2 à 6)

13. Cibler les sources citées par les LLMs pour le netlinking/RP
Reprendre la liste des sources identifiées en point 5. Ce sont les domaines sur lesquels concentrer les efforts de netlinking et de relations presse, pas les DA 80 génériques.

14. Stratégie Reddit
Lancer le Reddit FAQ Finder sur les thématiques clés → identifier les subreddits actifs et les questions récurrentes
Évaluer les threads existants : est-ce que la marque y est mentionnée ?
Si non : option 1 (commenter si les conditions sont réunies) ou option 2 (créer un thread plus complet, laisser maturer, glisser la mention)
Ne jamais mentionner la marque à froid dans un premier post

15. Stratégie YouTube
Lancer le YouTube Channel Exporter sur la chaîne de l’entreprise et celles des concurrents → exporter dans Claude pour un audit stratégique

Si l’entreprise a une chaîne : définir un rythme de publication réaliste et des formats alignés sur les requêtes cibles
Si elle n’a pas de chaîne : identifier des créateurs YouTube actifs sur la thématique → outreach pour sponsoring ou review

16. S’assurer d’apparaître dans les listicles tiers
Identifier les “best of”, comparatifs et roundups sectoriels qui remontent dans les réponses LLM sur les requêtes commerciales. Outreach vers les éditeurs pour y figurer avec des éléments différenciants concrets (données, études, témoignages clients).

PHASE 5 - Piloter en continu

17. Mensuel : LLM Brand Tracker
Relancer le panel de prompts. Observer :

Est-ce que le taux de citation progresse ?
Est-ce que la part de voix vs concurrents évolue ?
Est-ce que les sources citées ont changé ? (signal d’opportunité Earned Media)

18. Mensuel : Ahrefs
Surveiller l’évolution du volume de recherche de marque (branded search) → proxy indirect de la visibilité LLM
Surveiller les apparitions dans les AI Overviews sur les mots-clés suivis

19. Mensuel : GA4
Isoler le trafic entrant depuis les LLMs (user agents ChatGPT, Perplexity, etc.), puis mesurer son évolution et son taux de conversion

20. Tous les 6 mois : audit freshness
Passer en revue les pages piliers. Mettre à jour les chiffres, exemples et captures d’écran. Rafraîchir le signal temporel dans le texte. Le freshness bias récompense les vraies mises à jour, pas les changements de date cosmétiques.

Vous avez un besoin d'accompagnement en GEO ?

Contactez nous !