GEO : le guide ultime pour améliorer son référencement sur les moteurs IA & les LLMs

20 mai 2026
Pierre Ribeaucourt Directeur Acquisition

Faire du GEO semble simple sur le papier : produire du contenu, soigner ses sources et espérer apparaître dans ChatGPT. Sauf qu’en réalité, le CTR organique chute partout (avec ou sans AI Overviews) et les places visibles sont extrêmement limitées. Le principal piège serait de penser qu’il faut opposer SEO et GEO, comme s’il s’agissait de deux disciplines distinctes. Le GEO fait partie intégrante du SEO, il vient l’enrichir. C’est pour cela qu’intégrer cette dimension dans sa stratégie Search globale est devenu indispensable.

Chez Empirik, on a structuré notre approche autour de 3 leviers (Owned, Earned, Technique) et d’une boucle Définir → Déployer → Piloter. On partage ici notre méthodologie complète, étape par étape.

Qu'est-ce que le Generative Engine Optimization ?

Le GEO (Generative Engine Optimization) désigne l’ensemble des actions visant à faire apparaître une marque dans les réponses générées par les moteurs d’IA : ChatGPT, Gemini, Perplexity, et les AI Overviews de Google.

L’objectif n’est pas de “ranker sur ChatGPT” comme on rankerait sur Google. Il s’agit d’augmenter la part de voix conversationnelle d’un client, la fréquence à laquelle sa marque est citée en réponse à des requêtes pertinentes, et de s’assurer que cette présence contribue concrètement à ses résultats business.

Chez Empirik, le GEO ne se pratique pas en silo. Il se déploie en synergie avec le SEO, le CRO et la Data. Cette fiche explique comment.

Enjeux : pourquoi le GEO est urgent dès maintenant ?

À retenir :

  • Le CTR organique chute partout, avec ou sans AIO
  • Être cité > ne pas être cité (+35% CTR SEO / +91% SEA)
  • Les LLM influencent avant le clic (branding > trafic)
  • Il y a ~30 places visibles max par secteur

La fin du clic organique classique

Pendant des années, la mécanique était simple : une requête Google = une liste de liens = des clics vers les sites. Cette mécanique est en train de se briser.

Depuis le déploiement des AI Overviews, Google répond directement aux questions informationnelles sans nécessairement renvoyer vers un site. Le résultat est brutal sur les CTR organiques.

Les chiffres qui font mal

Situation CTR organique Evolution YoY
Requête sans AIO 1,62% -41%
Requête avec AIO, non cité 0,52% -65%
Requête avec AIO, cité 0,70% -49%

Source : Seer Interactive — AIO Impact on Google CTR, septembre 2025 – 42 clients, 25,1M impressions organiques, juin 2024 → sept. 2025

Deux points importants à retenir :

  • Il n’y a pas de zone safe. On pourrait croire que les requêtes sans AIO sont épargnées mais elles ne le sont pas. Elles ont perdu 41% de leur CTR en un an, probablement parce que les utilisateurs commencent leur parcours sur ChatGPT ou Perplexity avant même d’arriver sur Google.
  • Être cité dans l’AIO change tout. Un CTR à 0,70% face à 0,52% peut sembler anecdotique en valeur absolue, mais c’est +35% de clics organiques supplémentaires. Côté SEA, l’écart est encore plus frappant : +91% de CTR payant pour les annonceurs cités vs non cités.

"Even queries without AI Overviews are seeing 32-41% CTR declines. This isn't just an AIO problem, this is a fundamental shift in how users approach information-seeking."

Seer Interactive, septembre 2025

À retenir :
La question n'est plus "est-ce que l'AIO va impacter mon client ?" mais "à quel point est-il déjà impacté, et est-il cité ou invisible ?"

Les LLMs : une visibilité sans clics (pour l'instant)

ChatGPT, Gemini, Perplexity génèrent aujourd’hui moins de 1% du trafic sortant vers les sites web. Ce chiffre peut sembler dérisoire, et objectivement, il l’est encore.

Mais ce n’est pas la bonne façon de lire l’enjeu.

Les LLMs influencent les décisions en amont du clic. Quand un acheteur BtoB demande à ChatGPT “quelle est la meilleure solution de gestion de stock pour un restaurateur ?”, il ne clique peut-être pas immédiatement. Mais la marque qui apparaît dans la réponse installe une préférence. Celle qui n’apparaît pas n’existe pas dans cet instant de décision.

L’enjeu GEO sur les LLMs est aujourd’hui un enjeu de branding et de considération, pas encore de trafic direct. Ça va changer mais même à ce stade, ça n’est pas négligeable pour des clients dont le cycle de vente est long ou dont la décision d’achat est précédée d’une phase de recherche (Source : Empirik – Page GEO)

La loi des 30 domaines

Dans chaque secteur, la distribution des citations dans les LLMs est très concentrée et cette concentration ressemble à ce qu’on a connu avec les 10 premiers résultats Google, en pire.

La concentration des citations par secteur

Tableau
Périmètre Part des citations
Top 10 domaines d'un secteur 46%
Top 30 domaines d'un secteur 67%
Tous les autres domaines 33% (à se partager entre des centaines)

Source : Kevin Indig — The science of how AI picks its sources – 21 482 citations ChatGPT analysées, 670 domaines uniques, mars 2026

Concrètement : il y a environ 30 “sièges” à la table des citations pour n’importe quelle thématique. Tout le monde en dehors de ces 30 est quasi invisible dans les réponses IA.

La concentration varie fortement selon les secteurs :

Tableau
Secteur Concentration (top 10% des domaines) Opportunité pour un nouvel entrant
Éducation 59,5% (très fermé) ❌ Difficile
Crypto 43% ❌ Difficile
Finance 29,4% ⚠️ Possible sur niches
Healthcare 13% (très ouvert) ✅ Accessible
CRM / SaaS 16,1% ✅ Accessible
RH Tech 14,4% ✅ Accessible

"Fragmentation is your opening. In low-concentration verticals like Healthcare and CRM, a focused 30–50 page strategy can realistically compete for a seat at the table."

Kevin Indig, Growth Memo, mars 2026

À retenir :
Plus on intervient tôt, moins c'est difficile. La concentration tend à s'accentuer avec le temps, exactement comme en SEO, où les domaines établis de longue date sont aujourd'hui quasi inexpugnables sur leurs thématiques de cœur.

Être cité dans l'AIO : un avantage compétitif mesurable

La citation dans les AI Overviews n’est pas seulement un enjeu de visibilité, elle a un impact direct et mesurable sur les performances, y compris en dehors du SEO.

L'avantage de la citation - chiffres Q3 2025

Tableau
Pas d'AIO AIO non cité AIO cité
CTR organique 1,62% 0,52% 0,70%
CTR payant 13,04% 4,14% 7,89%
Écart vs non-cité - référence +35% organique ; +91% payant

Ce que ça implique pour les clients qui font du SEA : si leurs campagnes ciblent des requêtes informationnelles exposées aux AIO et qu’ils ne sont pas cités, leur CPL explose sans que leur CPC bouge. Le volume de clics s’effondre silencieusement. C’est un argument fort pour embarquer le pôle Paid dans la réflexion GEO dès le départ.

Nuance à avoir en tête : la causalité n’est pas prouvée. Il est possible que les marques citées aient simplement plus d’autorité, ce qui expliquerait à la fois leur citation ET leur meilleur CTR. Mais dans un sens comme dans l’autre, l’action à mener est identique : travailler l’autorité et la présence éditoriale.

Cette nuance est importante pour ne pas survendre la promesse GEO à un client.

Transformez les réponses IA en valeur business

En savoir plus
Transformez les réponses IA en valeur business

Comment apparaître dans les réponses IA ? La méthodologie Empirik

À retenir :

  • Le GEO repose sur 3 leviers :
      → Owned
      → Earned (mentions externes)
      → Technique (accessibilité)
  • Et une boucle : Définir → Déployer → Piloter
  • Le SEO est nécessaire mais insuffisant

Avant de rentrer dans les techniques, il faut poser le cadre. Le GEO est une discipline jeune, et beaucoup d’acteurs la pratiquent de façon désordonnée, une action Reddit par-ci, un contenu “optimisé pour l’IA” par-là, sans cohérence ni mesure. Ce n’est pas notre approche.

Chez Empirik, le GEO s’articule autour de 3 leviers, d’une boucle méthodologique en 3 étapes, et d’un principe fondamental : on ne sépare pas le GEO du SEO.

Les 3 leviers du GEO

Tout ce qu’on peut faire en GEO rentre dans l’une de ces trois cases. C’est la grille de lecture qu’on utilise pour structurer un plan d’action client.

Les 3 leviers en un coup d'œil

Tableau
Levier Ce que c'est Exemples d'actions
Owned Media Ce qu'on produit et contrôle directement Contenus longs, silos sémantiques, FAQ, données structurées, QBST
Earned Media Ce que les autres disent de nous Netlinking ciblé LLM, RP, Reddit, YouTube, mentions tierces
Technique Ce qui permet aux LLMs d'accéder au site Crawlabilité bots IA, robots.txt, performances, balisage

Ces trois leviers ne sont pas indépendants. Un contenu Owned parfaitement optimisé mais inaccessible aux crawlers LLM (problème Technique) ne sera jamais cité. Une marque qui génère de l’Earned Media mais dont le site est mal structuré n’ancre pas sa légitimité. Les trois doivent avancer ensemble.

La boucle Définir → Déployer → Piloter

La méthodologie Empirik suit trois étapes itératives. On ne déploie pas d’actions sans avoir défini un état des lieux. On ne pilote pas sans avoir déployé. Et le pilotage alimente systématiquement le cycle suivant.

Les 3 étapes en détail

① Définir
État des lieux de la visibilité LLM actuelle. Accessibilité technique aux crawlers. Construction du panel de prompts. Benchmark concurrents. Identification des sources citées sur la thématique. Croisement avec les performances SEO et l’exposition AIO.

② Déployer
Actions sur les 3 leviers en parallèle : optimisations Owned Media (contenus, structure, balisage), Earned Media (netlinking LLM, Reddit, YouTube, RP), Technique (crawlabilité bots, robots.txt, données structurées).

③ Piloter
Suivi continu via le LLM Brand Tracker + Analytics. Lecture croisée GEO / SEO / business (taux de citation, trafic organique, conversions). Alimentation du cycle suivant.

Source : Empirik – Méthodologie GEO

La boucle tourne en continu. En pratique, on recommande un cycle mensuel pour le benchmark LLM et un suivi hebdomadaire pour le SEO/Analytics (on y reviendra en section 6).

GEO ≠ SEO bis repetita

C’est probablement la question qu’on nous pose le plus souvent en avant-vente : “C’est quoi la différence avec du SEO ?”. La réponse courte : les fondamentaux sont les mêmes, mais les règles du jeu sont (légèrement) différentes.

Ce qui est commun : fournir la réponse la plus pertinente à l’utilisateur, en s’appuyant sur les mêmes piliers ( technique, contenu, autorité). Il est d’ailleurs impossible d’optimiser un site différemment pour le SEO et pour le GEO : on ne peut pas produire deux versions d’un même contenu, une pour Google, une pour ChatGPT.

Ce qui diffère : Google classe des pages web. ChatGPT ou Gemini, eux, construisent une réponse en citant des sources qu’ils jugent fiables. Ce n’est pas tout à fait la même logique.

SEO vs GEO : les différences clés

Tableau
SEO GEO
Mécanisme Classement de pages Construction d'une réponse avec citation de sources
Format du résultat Liste de liens cliquables Réponse synthétique (parfois avec sources)
Signal d'autorité Backlinks, E-E-A-T, ancienneté du domaine Mentions sur sources tierces citées par les LLMs, cohérence sémantique
KPI principal Position, trafic organique, CTR Taux de citation, citation reach, part de voix LLM
Outil de mesure Google Search Console, SEMrush… LLM Brand Tracker, AEO Grader
Cycle de résultats Semaines à mois Mois, opacité totale sur les volumes

Ce tableau appelle une nuance importante : le SEO reste un prérequis au GEO. Les études montrent qu’une page qui ranke en position 1 sur Google a 3,5 fois plus de chances d’être citée par ChatGPT qu’une page hors top 20. Autrement dit, un site SEO fort part avec une longueur d’avance en GEO mais ça ne suffit pas.

"Among pages ranking #1 in Google, 43.2% were cited by ChatGPT, 3.5x higher than the citation rate for pages ranking beyond Google's top 20."

Kevin Indig - The science of how AI picks its sources, Growth Memo, mars 2026

À retenir :
Le SEO est nécessaire mais pas suffisant. ChatGPT récupère environ 6 fois plus de pages qu'il n'en cite, 85% des pages récupérées ne sont jamais citées dans les réponses finales. Être bien ranké ouvre la porte, mais ça ne garantit pas d'entrer.

Source : Kevin Indig, mars 2026

Etape 1 : Diagnostic & Audit GEO

Avant de toucher quoi que ce soit, il faut savoir où on en est. Un audit GEO, c’est 4 questions dans l’ordre :

  1. Les LLMs peuvent-ils accéder au site ?
  2. La thématique du client est-elle exposée aux AI Overviews ?
  3. Où est la marque dans les réponses LLM vs ses concurrents ?
  4. Quelles pages SEO sont les plus menacées ?

1.1 - Vérifier l'accessibilité technique aux bots LLM

C’est le point de départ absolu, et c’est souvent là qu’on trouve les premières quick wins. Avant qu’un LLM puisse citer une source, il faut qu’il ait pu la lire. Or, beaucoup de sites bloquent involontairement (ou volontairement) les crawlers des LLMs dans leur robots.txt.

Les bots concernés : GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot, GoogleBot (pour les AI Overviews), Gemini (Google).

À retenir :
Un site qui bloque GPTBot ne peut pas être cité par ChatGPT, peu importe la qualité de ses contenus. C'est un frein technique total à identifier en 30 secondes dès la phase de prospection.

1.2 - Mesurer l'exposition de la thématique aux AI Overviews

Tous les secteurs ne sont pas égaux face aux AI Overviews. Une thématique très transactionnelle (ex. “acheter chaussures running”) est moins exposée qu’une thématique informationnelle (ex. “comment choisir ses chaussures de running”). Avant de construire un plan d’action, il faut objectiver cette exposition.

1.3 - Premier diagnostic rapide avec l'AEO Grader

Avant de sortir le LLM Brand Tracker, l’AEO Grader de HubSpot permet de générer un rapport de visibilité LLM en quelques minutes gratuitement. C’est l’outil d’entrée en matière idéal en avant-vente : concret, visuel, et souvent révélateur pour un client qui ne mesure pas encore l’enjeu.

Les 5 dimensions du rapport AEO Grader

Tableau
Dimension Ce qu'elle mesure
Brand Recognition Visibilité de la marque sur les canaux digitaux. Score de reconnaissance, profondeur des mentions, qualité des sources
Market Competition Part de voix dans les conversations du secteur vs concurrents. Nombre de mentions, contextes de comparaison
Presence Quality Qualité et cohérence de la présence en ligne : structure, contenu, données disponibles
Brand Sentiment Tonalité des réponses IA sur la marque. Score général + contextuel + polarisation des sources
Share of Voice Part de voix directe dans les réponses LLM sur les requêtes du secteur

Nuance sur la fiabilité : l’AEO Grader est un outil d’entrée en matière, pas un instrument de mesure précis. Les scores peuvent varier d’une génération à l’autre et les données sous-jacentes ne sont pas toujours vérifiables. On l’utilise pour ouvrir la conversation, pas pour piloter une stratégie.

1.4 - Benchmarker en continu avec le LLM Brand Tracker

C’est l’outil central du dispositif GEO Empirik. Là où l’AEO Grader donne une photo, le LLM Brand Tracker donne un film.

Le principe : on définit un panel de prompts représentatifs de la thématique et des personas du client. L’outil les interroge tous les jours sur ChatGPT et Gemini, et retourne pour chacun : est-ce que la marque est citée ? Quelles sources ont été utilisées pour construire la réponse ? Est-ce que le prompt a déclenché une recherche web ?

Limitation connue : les query fan-out (questions dérivées que les LLMs génèrent autour d’une thématique) ne sont plus récupérables sur les modèles GPT récents. Ils restent accessibles sur Gemini et les anciens modèles OpenAI. C’est une régression récente, à surveiller.

1.5 - Identifier les pages SEO exposées et prioriser le CRO

La dernière étape du diagnostic consiste à croiser les données SEO avec l’exposition AIO.

L’objectif : identifier les pages qui vont perdre du trafic et décider lesquelles méritent un effort CRO pour compenser.

La logique est simple : moins de clics entrants = chaque visite doit davantage convertir.

Une page à fort trafic organique sur des requêtes très exposées aux AIO est une priorité CRO immédiate.

Etape 2 : Optimisation GEO Owned Media : techniques, structure, contenus, etc

À retenir :

  • Le format dépend de l’intention (info / commercial)
  • Les listicles marchent surtout en tiers, pas en auto-promo
  • Forums / discussions = poids réel

L’Owned Media, c’est ce qu’on contrôle directement : les contenus du site, leur structure, leur balisage.

C’est le levier sur lequel on a le plus de prise et aussi celui qui demande le plus de rigueur, parce que les LLMs ne lisent pas un site comme Google le fait.

2.1 - Produire les bons formats pour les bonnes intentions

La première question à se poser avant de créer ou d’optimiser un contenu GEO : quelle est l’intention de recherche derrière les prompts qu’on cible ?

Ce n’est pas le secteur du client qui détermine le format idéal, c’est ce que l’utilisateur cherche à accomplir.

Format de contenu × intention de recherche

Source : Wix AI Search Lab – The content types most cited by LLMs – analyse de 75 000 réponses IA, 1 056 727 citations

Quelques points contre-intuitifs à retenir :

  • Les listicles ne sont pas morts à condition qu’ils soient tiers. En professional services, 80,9% des listicles cités dans les LLMs proviennent de sites tiers neutres, pas de la marque elle-même.
  • Créer un listicle auto-promotionnel où on se met en n°1 est peu efficace. En revanche, être référencé dans les listicles des autres est un levier Earned Media majeur.
  • Les discussions (forums, Reddit) pèsent plus lourd qu’on ne le croit en contexte commercial, 11% des citations sur les requêtes commerciales. On y reviendra.

Source : Wix AI Search Lab

2.2 - Longueur et structure : ce que les LLMs lisent vraiment

À retenir :

  • < 1000 mots = mort
  • Les LLM lisent surtout le début (10–20%)
  • Une page multi-intent > pages mono-intent

La règle des 10 000 mots

La longueur corrèle significativement avec le taux de citation mais avec des nuances importantes selon le secteur.

Longueur cible selon le secteur

Tableau
Secteur Longueur optimale Logique
Éducation, Crypto, SaaS technique 10 000 mots+ La profondeur = signal d'autorité
Finance 5 000 – 10 000 mots Les pages trop longues diluent les données clés
Healthcare 2 000 – 5 000 mots Trop de détail clinique nuit à la citation
CRM / RH Structure > longueur Format et balisage comptent plus que le nombre de mots

À retenir :
La règle universelle : les pages de moins de 1 000 mots sous-performent dans tous les secteurs sans exception. Le contenu thin n'a pas de place dans une stratégie GEO.

Où les LLMs lisent dans une page

Les LLMs ne lisent pas une page de façon linéaire de haut en bas. Ils prêtent une attention disproportionnée à certaines zones.

Répartition de l'attention des LLMs dans une page

Tableau
Zone de la page Niveau d'attention Ce que ça implique
0 – 10% (intro, nav) Faible Les LLMs sautent les intros génériques
10 – 20% (début du contenu) ⭐⭐⭐ Maximum Mettre les informations clés tôt
20 – 60% (corps) Moyen à bon Maintenir la densité informationnelle
60 – 90% (fin de corps) Décroissant
90 – 100% (conclusion, footer) Quasi nul Les conclusions sont invisibles aux LLMs

"The bottom 10% of any page earns 2.4 - 4.4% of citations, roughly a quarter of what the peak band earns. The conclusion section is nearly invisible to AI, regardless of vertical."

Kevin Indig - Growth Memo, mars 2026

En pratique : ne pas enterrer les informations stratégiques dans une conclusion.

Mettre les définitions clés, les données chiffrées et les positions de la marque dans le premier tiers du contenu.

Les intros de 3 paragraphes qui “posent le contexte” sans rien dire sont à proscrire.

La page evergreen multi-intent : le Saint Graal

L’analyse de 21 000+ citations ChatGPT révèle un pattern systématique : les pages citées sur 10+ prompts distincts sont toutes des guides de catégorie à couverture large (format “best X 2026”, qui répond en une seule URL aux questions “qu’est-ce que c’est”, “comment choisir”, “quels sont les meilleurs”, “combien ça coûte”).

La raison mécanique à ça, c’est le RRF (Reciprocal Rank Fusion).

Quand un LLM opère par query fan-out, il lance plusieurs sous-requêtes en parallèle et fusionne les résultats via RRF : une page qui remonte sur plusieurs sous-requêtes se voit attribuer un score agrégé bien supérieur à une page qui n’apparaît que sur une seule.

Une page evergreen qui couvre 5 angles d’une thématique sera donc systématiquement remontée plus haut dans la synthèse finale qu’une page mono-intent même si cette dernière est “meilleure” sur sa requête spécifique.

Une seule page evergreen bien construite vaut plus que 10 pages mono-intent.

Le ROI du contenu GEO est front-loadé : une page bien structurée continue de cumuler de la citation reach dans la durée, là où une page trop spécialisée n’apparaît que sur une poignée de requêtes.

Source : Kevin Indig

Transformez les réponses IA en valeur business

En savoir plus
Transformez les réponses IA en valeur business

2.3 - Création de nouveaux contenus en silos GEO

Les LLMs ne répondent pas à une requête isolée.

Ils opèrent par query fan-out : à partir d’une question principale, ils génèrent une série de sous-questions pour construire une réponse complète.

Une marque qui ne couvre que l’angle principal d’une thématique sera absente de la plupart des réponses construites autour de cette thématique.

Exemple : sur le prompt “meilleure agence SEO à Lyon”, un LLM va typiquement chercher :

  • “qu’est-ce qui différencie une bonne agence SEO”
  • “quels sont les critères de sélection”
  • “quelles agences SEO sont reconnues en France”
  • “avis clients agences SEO Lyon”
  • etc.

Si on n’est présent que sur la requête principale, on rate tous les angles dérivés.

Quand le client sait exactement sur quels prompts il veut être cité, voici les contenus à produire sur le site et le maillage à mettre en place.

Source : Rankit – Livre blanc GEO GreenRed 2026

À retenir :

  • Un dispositif compact : X pages exact match (1 par prompt) + 1 page FAQ pivot + 1 page FAQ pivot version EN
  • Règle centrale : title = H1 = slug = prompt mot pour mot sur les X pages
  • La page FAQ agrégatrice EN est le levier le plus rentable observé (94 citations en 10 jours sur le concours)
  • Cohérence factuelle stricte sur les X+1 pages : une divergence fait sortir du panorama Claude

La stratégie du "X +1" :

Cette stratégie est la stricte déclinaison de celle appliquée par Frédéric Jezegou présentée dans son livre blanc GEO GreenRed 2026.

① Choix du domaine
Si le domaine n’est pas encore arrêté : privilégier un nom de domaine avec historique et autorité déjà installée. Un domaine neuf démarre avec un handicap sur la fenêtre de 8 à 10 semaines du dispositif.

② Production des X pages exact match
Une page par prompt cible. Règle stricte : title = H1 = slug = prompt mot pour mot. Aucune reformulation dans ces trois éléments. Les H2 internes, la meta description et le corps du contenu peuvent (et doivent) être reformulés. URL sur un chemin court et propre, pas enterrée à 3 niveaux.

③ Production de LA page guide-FAQ agrégatrice
Créer une URL unique qui reprend les 10 prompts au format FAQ. Chaque question en H2 reproduit le prompt mot pour mot. Balisage FAQPage JSON-LD obligatoire avec les X Q/R. Contenu dense, pas un simple résumé des 10 pages. C’est la page pivot éditoriale du dispositif : le guide ultime.

④ Maillage croisé
Depuis chaque page exact match : liens contextuels vers la page FAQ pivot + 3 à 5 pages sœurs pertinentes.
Depuis la page FAQ pivot : lien explicite vers chacune des X pages exact match en fin de réponse de chaque bloc FAQ.

⑤ Cohérence factuelle stricte
Tous les chiffres clés, dates, noms d’entités doivent être identiques sur les X+1 pages (X exact match + 1 page agrégatrice). Une divergence même minime fait sortir la source du panorama Claude.

En pratique :

  • Établir une fiche factuelle maître en amont
  • Rédiger toutes les pages à partir de cette fiche
  • Appliquer la même logique au JSON-LD

⑥ Dupliquer et traduire la page agrégatrice en anglais
Une seule page, en anglais intégral, avec un mot d’autorité explicite dans l’URL et le title (official site, complete guide, etc.). Positionnement pivot et non satellite : elle ne cible aucun prompt spécifique mais résume l’offre.

  • hreflang="en" + lien réciproque depuis la home FR
  • Ciblage Claude et Mistral principalement
  • Levier le plus rentable observé sur le concours (94 citations en 10 jours)

⑦ Pattern d’autorité
À déployer uniquement si la substance existe réellement côté client. Éléments à installer sur chaque page :

  • Entité nommée clairement
  • Experts identifiés avec titres vérifiables
  • Protocoles ou méthodes codés (nom propre)
  • Indices propriétaires
  • Chiffres précis répétés à l’identique sur chaque page

C’est ce qui déclenche les citations sur Mistral et Claude.

2.4 - Données structurées (JSON-LD)

Le JSON-LD seul a un effet marginal sur les citations LLM. Ce qui compte vraiment, c’est que les informations clés soient lisibles et navigables dans le HTML visible. Le markup ne fait que redire ce qui doit déjà être dans le texte.

On l’implémente quand même : ça ne nuit jamais, Bing/Copilot l’utilisent officiellement, et FAQPage + HowTo restent les formats les plus extractables.

Les données structurées ont un impact sur le GEO mais bien plus indirect et conditionnel que ce qu’on lit souvent dans les articles SEO.

Avant de baliser frénétiquement tout un site, voilà ce que la recherche dit réellement.

Ce qui est établi : un effet modeste seul, fort en combinaison

L’étude contrôlée la plus solide disponible à date (Volpini, Raad, Gamba, Riccitelli, préprint 2026, testé sur 4 secteurs, ~2 439 évaluations) montre que l’ajout de JSON-LD seul sur du HTML n’apporte qu’un gain marginal (Δ ≈ +0,27 sur une échelle de 1 à 5).

En revanche, les pages entités “enhanced” avec liens matérialisés vers d’autres entités, breadcrumbs structurés, sections Q&A navigables apportent un gain de +29 à 30% en précision dans ces mêmes pipelines.

Cette étude est signée par l’équipe de WordLift, qui vend des outils d’optimisation de pages pour agents IA. Conflit d’intérêts réel sur les conclusions positives de l’étude. En revanche, le résultat négatif sur le JSON-LD seul (+0,27) est peu contestable : Volpini n’avait aucune raison de le minimiser artificiellement. (Source : Volpini et al., arXiv 2603.10700)

L’explication technique est simple : si un LLM ingère une page “comme du texte aplati”, le JSON-LD embarqué dans le <script> peut être ignoré ou dilué dans l’embedding. Le markup ne sert que si le système d’indexation l’extrait et l’indexe comme structure séparée. Ce n’est pas garanti sur ChatGPT, Gemini ou Perplexity, ces systèmes sont des boîtes noires.

Ce qui est suggéré mais non prouvé :

  • Un test industriel (Nogami & Tannenbaum, Search Engine Land, 2025) sur 3 pages quasi identiques montre que seule la page avec un schema de bonne qualité est apparue dans les AI Overviews mais les auteurs eux-mêmes qualifient le résultat de “prometteur mais non conclusif” (N=3, variables confondantes). (Source : Search Engine Land)
  • Microsoft affirme officiellement que le schema markup aide ses systèmes Bing/Copilot à comprendre et parser le contenu. (Source : Microsoft Advertising Blog)
  • La documentation Google Search Central confirme l’usage des données structurées pour comprendre le contenu et activer des rich results, mais ne précise nulle part leur impact sur la sélection des sources dans les AI Overviews. (Source : Google Search Central)

Ce qui n’est pas prouvé du tout :

La causalité “ajouter du JSON-LD = être plus cité par ChatGPT” n’est démontrée par aucune source primaire accessible.

La documentation officielle d’OpenAI décrit le mécanisme de citation (via outils web_search et file_search) sans mentionner le JSON-LD comme signal favorisant la sélection.  (Source : OpenAI API Docs)

En clair : les chiffres “+28% pour FAQPage” et “+24% pour HowTo” qu’on trouve dans certains articles SEO proviennent d’une étude Relixir dont la méthodologie n’est pas reproductible. Ne pas les citer comme vérités établies en avant-vente.

Ce qu’on fait quand même, et pourquoi :

Malgré ces nuances, on continue à implémenter les données structurées pour deux raisons valides :

Premièrement, l’effet est conditionnel mais réel dans les pipelines qui extraient correctement le JSON-LD (et c’est le cas de certains systèmes de Bing/Copilot selon leur documentation), le balisage aide à la compréhension et au parsing. C’est un signal de qualité qui ne nuit jamais.

Deuxièmement, l’approche la plus robuste n’est pas “baliser et espérer”, c’est rendre les informations entités visibles et navigables dans le contenu lui-même.

Une page où les faits clés (adresse, horaires, définitions, Q&A) sont présentés clairement dans le HTML visible sera extractable par un LLM même si celui-ci ignore complètement le JSON-LD.

Le balisage ne fait que redondance avec ce qui doit déjà être dans le texte.

Priorités d'implémentation (dans cet ordre)

Tableau
Type Cas d'usage Pourquoi
FAQPage Pages avec section FAQ Aligne le contenu avec les requêtes conversationnelles, l'effet passe autant par le format visible que par le markup
HowTo Contenus step-by-step Structure extractable par les LLMs
Article + dateModified Articles de blog Signal de fraîcheur, renforce le freshness bias (section 4.6)
Organization Homepage Aide les LLMs à identifier et attribuer correctement la marque
LocalBusiness + GeoCoordinates Clients avec composante locale Critique pour le local : adresse, horaires, coordonnées exactes (Source : Google - LocalBusiness)
Product E-commerce Facilite l'extraction des attributs produit

Règle d’or :
le JSON-LD doit toujours refléter fidèlement le contenu visible de la page. Baliser des informations non présentes dans le HTML est une violation des guidelines Google et contre-productif en GEO puisque le LLM ne trouvera pas dans le texte ce que le markup lui promet. (Source : Google SD Policies)

Sources :
Volpini et al. — JSON-LD vs Entity Pages in RAG (arXiv 2603.10700)
Nogami & Tannenbaum — Schema & AI Overviews (Search Engine Land, 2025)
Microsoft — Optimizing content for AI Search Answers
Microsoft — Bing/Copilot use schema for LLMs (Search Engine Land)
Google Search Central — Structured Data
Google Search Central — LocalBusiness
OpenAI — Citation Formatting

2.5 - Production avec Thot SEO

À retenir :

  • Les LLM attendent un champ lexical précis
  • Décrire ≠ nommer → il faut les bons termes

L’optimisation QBST (Query Based Salient Terms) consiste à identifier les termes saillants qu’un système automatisé associe à une requête donnée pour évaluer la pertinence et l’autorité d’une page sur un sujet.

Ce n’est pas du keyword stuffing, c’est de l’alignement sémantique : s’assurer que le contenu contient les termes que le modèle “attend” pour considérer la page comme une source fiable sur cette thématique.

Un exemple concret vaut mieux qu’une définition :

Texte non optimisé :Je suis une petite bête verte un peu gluante, je fais des grands sauts de nénuphar en nénuphar et je mange des moustiques. → Un robot ne reconnaît pas le sujet. Pas de grenouille. ❌

Texte optimisé :Je fais partie de la famille des batraciens et je suis également un anoure. → Le robot reconnaît immédiatement le sujet. ✅

Ce qui a changé : le second texte utilise les termes du champ lexical attendu, les mots que les modèles associent mathématiquement à ce sujet.

Le premier texte décrit la grenouille sans jamais utiliser les termes qui permettent à un robot de l’identifier.

Ce score d’alignement sémantique est calculable sous forme de pourcentage : c’est le score sémantique.

C’est Thot SEO (outil acquis par Empirik) qui permet d’identifier ces termes saillants pour une requête cible, de calculer le score sémantique d’une page existante, et de guider la rédaction en conséquence.

L’outil permet de travailler le champ sémantique, la densité QBST et la structure des contenus sans multiplier les outils ou les allers-retours ainsi qu’optimiser simultanément pour Google et pour les LLMs sans produire deux versions d’un même contenu.

2.6 - Le biais de fraîcheur (freshness bias)

À retenir :

  • Les contenus récents sont favorisés
  • Le signal doit être dans le texte, pas juste en meta

👉 Quick wins

  • “Mis à jour en 2026”
  • Ajouter des exemples récents

C’est probablement le quick win le plus accessible en GEO et l’un des mieux documentés scientifiquement.

Les LLMs embarquent un biais de fraîcheur : à contenu égal, ils favorisent systématiquement les sources récentes lors de l’étape de reranking. Ce biais a été confirmé simultanément par un chercheur indépendant dans le code de production de ChatGPT, et par une étude académique.

La preuve dans le code : dans les fichiers de configuration de ChatGPT, le paramètre use_freshness_scoring_profile: true confirme qu’OpenAI applique un scoring de fraîcheur systématique pour favoriser les contenus récents lors du reranking.

La preuve en laboratoire : une équipe de l’Université Waseda a testé 7 modèles (GPT-3.5, GPT-4o, GPT-4, LLaMA-3 8B/70B, Qwen-2.5 7B/72B) en injectant des dates de publication artificielles sur des passages identiques.

Résultat : les passages “frais” sont systématiquement promus, déplaçant certains résultats de jusqu’à 95 rangs. La préférence entre deux passages de qualité identique peut être inversée dans 25% des cas après injection d’une date récente.

Point technique important : le freshness bias n’apparaît pas au niveau des query fan-out. Il se manifeste exclusivement lors du reranking, quand le LLM reçoit des documents comportant une date explicite dans le texte. Ce qui signifie que le signal temporel doit être visible dans le contenu lui-même pas seulement dans les métadonnées.

Et les chiffres terrain confirment : 65% des hits de crawlers IA ciblent du contenu publié dans l’année en cours, et 79% du contenu des deux dernières années.

Ce que ça implique en pratique

Tableau
Action Impact Priorité
Ajouter un signal temporel explicite dans le texte Très fort ⭐⭐⭐
Mettre à jour les pages piliers avec exemples/chiffres récents Fort ⭐⭐⭐
Ajouter dateModified dans le schema Article Moyen ⭐⭐
Mentionner l'année dans title et meta description Moyen ⭐⭐
Créer du contenu réactif sur des tendances sectorielles Variable

Concrètement : ajouter des formulations comme “Mis à jour en mars 2026” ou “Données vérifiées en 2026” directement dans le corps du texte est littéralement l’un des signaux les plus valorisés par les LLMs lors du reranking. C’est 30 secondes de travail sur une page existante.

La nuance à avoir : les chercheurs avertissent d’une possible “course aux armements temporelle”, les éditeurs peuvent gonfler leurs rankings avec de faux labels “mis à jour en 2026”, ce qui pourrait pousser les LLMs à détecter et pénaliser les mises à jour superficielles.

La mise à jour doit donc être réelle : nouveaux exemples, chiffres réactualisés, captures d’écran fraîches. Une mise à jour cosmétique de la date sans fond n’est pas une stratégie durable.

Sources :
Metehan Yesilyurt — I Found It in the Code, Science Proved It in the Lab
Waseda University — Do LLMs Favor Recent Content? (arXiv 2509.11353)
Search Engine Land — Researchers fooled AI models with fake dates
Seer Interactive — AI Brand Visibility and Content Recency

2.7 - Exemple de règles de rédaction adaptées à l’IA

À retenir :

  • Les LLMs extraient des fragments, pas des pages entières
  • Chaque phrase doit être autonome et compréhensible hors contexte
  • Le signal doit être dans le texte, pas seulement dans les balises

👉 Quick wins

  • Remplacer les pronoms vagues ("il", "cela") par l'entité nommée
  • Ouvrir chaque section par une affirmation de 40-60 mots
  • Viser moins de 5 000 caractères par section thématique

Source : How to write for AI search: A playbook for machine-readable content

Résumé de l'article

Le GEO copywriting repose sur un principe fondamental : les LLMs ne lisent pas une page de haut en bas. Ils la découpent en fragments indépendants et n’en retiennent qu’une fraction.

Écrire pour les moteurs IA signifie structurer le langage lui-même, pas seulement le balisage autour.

Le grounding budget : Google Gemini opère sur un budget de récupération d’environ 1 900 mots par requête, répartis sur plusieurs sources.

Chaque page individuelle se voit allouer environ 380 mots. La concision et la densité ne sont pas un choix stylistique, elles sont une contrainte technique.

Le triplet sémantique : une phrase GEO-friendly doit contenir trois éléments : une entité nommée explicitement (sujet), un verbe de relation précis (prédicat), et une donnée vérifiable assortie d’une condition (objet).

Ce schéma [Entité] + [Relation] + [Donnée + Condition] est directement extractable par un LLM sans inférence.

Point technique important : Google utilise des embeddings vectoriels au niveau du passage. Un titre H2/H3 placé au-dessus d’un paragraphe améliore la similarité cosinus (pertinence mathématique) de ce passage de jusqu’à 17,54 %. Les titres ne sont pas que des éléments de navigation, ce sont des ancres sémantiques.

Les chiffres terrain confirment l’impact de la densité sur l’extraction : les pages de moins de 5 000 caractères voient 66 % de leur contenu utilisé par les IA, contre seulement 12 % pour les pages dépassant 20 000 caractères.

Ce que cela implique en pratique

🔴 Priorité haute

  • Nommer explicitement l’entité dans chaque phrase → élimine les erreurs d’inférence du LLM
  • Ouvrir chaque section par une affirmation dense de 40-60 mots → maximise l’extraction en début de passage
  • Remplacer tout adjectif vague par une donnée chiffrée → passe le filtre de densité informationnelle

🟠 Priorité moyenne

  • Réduire les sections à moins de 5 000 caractères → améliore le taux d’extraction (66 % vs 12 %)
  • Titres H2/H3 contenant l’entité principale + l’intention → +17,54 % de similarité cosinus

🟡 Maintenance

  • Test d’isolation : lire une phrase au hasard hors contexte → détecte les dépendances cachées

Etape 3 : Optimisation GEO Earned Media : RP, YouTube, Reddit, lining

L’Earned Media, c’est tout ce qu’on ne contrôle pas directement : les mentions sur des sites tiers, les discussions sur les forums, les vidéos YouTube qui citent une marque, les articles de presse, les comparatifs. C’est pourtant là que se joue une grande partie de la visibilité GEO, parce que les LLMs ne se fient pas uniquement au site d’une marque pour la citer. Ils s’appuient sur ce que le reste du web dit à son sujet.

3.1 - YouTube : la source n°1 des AI Overviews

À retenir :

  • Source n°1 des AIO (~30%)
  • Les transcriptions = données LLM

👉 Stratégie

  • Créer du contenu
  • OU être mentionné par des créateurs

C’est le chiffre qui surprend le plus les clients : YouTube est le domaine le plus cité dans les AI Overviews de Google, devant tous les sites d’experts, tous les médias, toutes les marques.

YouTube dans les AI Overviews

  • 29,5% des AI Overviews de Google citent YouTube comme 1ère source toutes catégories confondues
  • GPT-4 a été entraîné sur plus d’1 million d’heures de transcriptions YouTube (New York Times)
  • Les LLMs ne pouvant pas diffuser de vidéo, ils préfèrent naturellement citer YouTube quand le prompt le demande

Sources : Ahrefs — How to rank on ChatGPT

Il y a deux raisons à cette domination :

  • YouTube est une source massive de données d’entraînement pour les LLMs. Une mention dans une transcription vidéo devient un signal dans le modèle lui-même.
  • Les LLMs incapables de restituer du contenu vidéo directement orientent vers YouTube quand une réponse visuelle serait plus adaptée.

Deux stratégies complémentaires :

Créer sa propre chaîne. Publier régulièrement des vidéos sur les thématiques stratégiques du client. Les transcriptions auto-générées par YouTube sont indexables par les LLMs, chaque vidéo est potentiellement une nouvelle source citeable. Optimiser les titres, descriptions et chapitres pour les requêtes cibles.

Obtenir des mentions sur des chaînes tierces. C’est souvent plus rapide et plus impactant. Un créateur avec 50 000 abonnés qui mentionne une marque dans une vidéo populaire génère des signaux d’entraînement bien plus puissants qu’une chaîne de marque démarrée de zéro. Formats possibles : sponsoring, review produit, interview, guest appearance.

🛠️ Outil : YouTube Channel Exporter

Notre outil Youtube Channel Exporter exporte toutes les statistiques disponibles d’une chaîne YouTube en un clic : vues, formats, rythme de publication, thématiques.

Lancer sur la chaîne du client + chaînes concurrentes → envoyer les données dans Claude avec le bon prompt → audit stratégique complet en quelques minutes.

3.2 - Reddit : s'insérer dans les discussions que les LLMs lisent

À retenir :

  • Source clé pour les LLM (authenticité)
  • Nécessite temps + crédibilité

👉 Règles

  • Warm-up obligatoire
  • Pas de spam
  • Valeur avant promo

Reddit reste l’une des sources les plus consultées par les LLMs dans de nombreux secteurs, notamment parce que ses discussions sont perçues comme authentiques, non commerciales, et riches en langage naturel conversationnel. Exactement le type de contenu sur lequel les LLMs ont été massivement entraînés.

La stratégie Reddit demande de la patience et de la subtilité. Il ne s’agit pas de spam, les modérateurs et les algorithmes de Reddit sont rodés à détecter la promotion déguisée, et une marque grillée sur Reddit l’est pour longtemps.

Le plus simple consiste à passer par Whitepress qui ont un service dédié à Reddit :

Mais on peut aussi décider de le faire nous-même et/ou avec le client. La stratégie se déploie en quatre phases séquentielles : on ne poste pas sans avoir warmé son compte, on ne mentionne pas une marque sans avoir d’abord construit de la crédibilité dans le subreddit.

SETUP  (à faire une seule fois) : 

Checklist Reddit

L'objectif de cette phase : cartographier le terrain avant d'y poser un pied.

🛠️ Outil : Reddit FAQ Finder

Reddit FAQ Finder identifie rapidement les meilleurs subreddits et les questions les plus posées sur une thématique. Double usage : alimenter le panel de prompts du LLM Brand Tracker, ou repérer les threads sur lesquels prendre la parole.

Checklist Reddit

WARM-UP  (2 à 4 semaines minimum)

Sans karma, un compte ne peut pas poster utilement, Reddit filtre ou shadow-ban les nouveaux comptes trop agressifs. Cette phase sert à construire la crédibilité avant de chercher à en tirer quoi que ce soit.

Checklist Reddit

CONTENT : Commenter ou créer ?

Une fois le compte warmé, l’objectif n’est pas de poster le plus souvent possible, c’est de poster au bon endroit, sur le bon angle, avec le bon niveau de promotion selon où se trouve l’utilisateur dans son parcours d’achat.

La première décision à prendre pour chaque thread identifié dans ton Google Sheet : est-ce qu’il vaut mieux intervenir sur l’existant ou en créer un nouveau ?

→ Commenter un thread existant est pertinent quand le thread remonte déjà dans les sources consultées par les LLMs. C’est le signal qu’il est lu par les modèles, et qu’une intervention dessus a un impact potentiel immédiat.

Condition : le thread doit être encore ouvert aux commentaires et la modération doit être tolérante. Si c’est le cas, contribuer réellement à la discussion d’abord, glisser la mention de la marque ensuite, jamais l’inverse.

→ Créer un nouveau thread est souvent la meilleure option sur les sujets où les threads existants sont fermés, trop anciens, ou insuffisamment complets. Le principe : traiter la même question de façon plus utile que ce qui existe déjà, sans mentionner la marque au lancement.

Laisser la discussion s’installer, répondre aux commentaires, construire de l’engagement. Quelques jours plus tard, éditer le post initial pour introduire la mention naturellement. A ce stade, le thread a de la vie et la mention passe comme une recommandation, pas comme de la pub.

Dans les deux cas, le niveau de promotion doit être indexé sur la profondeur de funnel du thread. Sur un thread BOFU “quelqu’un connaît un bon outil pour X ?”, une mention directe est attendue et légitime. Sur un thread TOFU ou MOFU, l’objectif est de construire de la crédibilité, pas de convertir. Une marque qui apparaît systématiquement dans les discussions utiles d’un subreddit installe une préférence bien plus efficacement qu’un commentaire qui se finit par un lien.

Trois points d’exécution pour tenir cette stratégie dans la durée :

Checklist Reddit

MESURE & ITÉRATION

Pour suivre les retombées de nos actions :

Checklist Reddit

3.3 - Netlinking et RP ciblés LLM

À retenir :

  • On cible les sources utilisées par les LLM ,pas juste le DA
  • Un site de niche cité > gros média ignoré

Le netlinking GEO n’est pas le netlinking SEO. En SEO, on cherche des liens depuis des domaines à fort DA. En GEO, on cherche des mentions sur les sources que les LLMs consultent effectivement sur nos thématiques, ce qui n’est pas toujours la même chose.

Un backlink depuis un DA 80 généraliste ne vaut pas grand chose en GEO si les LLMs ne s’y réfèrent jamais sur les sujets du client. En revanche, une mention sur un site de niche à DA 35 qui est systématiquement cité par Perplexity sur les requêtes cibles est un levier GEO majeur.

La démarche concrète :

  1. Lancer le LLM Brand Tracker sur les prompts stratégiques du client
  2. Extraire les sources effectivement citées par les LLMs sur ces prompts
  3. Construire le plan de netlinking/RP en ciblant prioritairement ces sources
  4. Mesurer l’évolution du taux de citation après les actions

C’est une inversion complète de la logique SEO classique : on part des sources citées par les LLMs pour remonter vers les opportunités de liens, plutôt que de partir des métriques de domaine.

3.4 - Les listicles et comparatifs tiers : être dans les listes

À retenir :

  • Très cités en requêtes commerciales
  • 80% = sources tierces

Les listicles tiers (“Les meilleures agences SEO à Lyon”, “Top 10 des outils de gestion de projet”)  sont l’un des formats les plus cités par les LLMs sur les requêtes commerciales (40,86% des citations selon l’étude Wix).

Mais attention à la nuance : ce sont les listicles tiers et neutres qui performent, pas les listicles auto-promotionnels.

Listicles tiers vs auto-promotionnels en professional services

Tableau
Type Part des citations listicles
Listicles tiers (site neutre) 80,9%
Listicles auto-promotionnels 19,1%

La stratégie : identifier les comparatifs, roundups et “best of” sectoriels qui remontent dans les réponses LLM sur les requêtes commerciales du client, et travailler à y figurer via RP, outreach direct aux éditeurs, ou en fournissant des éléments différenciants (études, données, témoignages) qui justifient l’inclusion.

À retenir :
Créer un listicle sur son propre site où on se met en n°1 est contre-productif en GEO. L'effort est bien mieux placé sur l'inclusion dans des listes tierces indépendantes.

3.5 - E-E-A-T et signaux d'autorité externe

À retenir :

  • Toujours clé
  • Les LLM favorisent :
    • experts identifiés
    • données originales
    • mentions médias

Les signaux E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) restent un prérequis en GEO comme en SEO. Les LLMs s’appuient sur les mêmes signaux de confiance que Google pour évaluer la fiabilité d’une source : présence de bios d’auteurs crédibles, citations de sources reconnues, cohérence des mentions sur le web, présence dans des médias de référence.

Quelques actions concrètes à fort impact :

  • Bios d’auteurs détaillées. Nom, titre, expertise, liens vers profils LinkedIn et publications. Un contenu attribué à un expert identifiable est plus citable qu’un contenu anonyme.
  • Données originales et études propriétaires. Les LLMs citent préférentiellement les sources qui produisent des données qu’on ne trouve nulle part ailleurs. Un client qui publie une étude annuelle sur son secteur devient une source de référence incontournable.
  • Mentions dans des médias reconnus. Un article dans Les Echos, une interview dans un podcast sectoriel de référence, une citation dans une étude universitaire, ces mentions sont des signaux d’autorité que les LLMs intègrent dans leur évaluation de la fiabilité d’une marque.

Sources :
Ahrefs — How to rank on ChatGPT 
Wix AI Search Lab — The content types most cited by LLMs
Firebrand — GEO Best Practices 2026

Etape 4 : Mesure des citations/mentions sur les LLMs & impact sur la performance digitale

Le GEO est une discipline encore opaque : pas de Search Console dédiée, pas de volumes de recherche officiels. Le pilotage se fait avec les outils qu’on a construits et les proxys qu’on a identifiés.

Part de voix et mentions dans les LLMs – LLM Brand Tracker
Le KPI central. Sur le panel de prompts défini en audit, on suit l’évolution du taux de citation par LLM (ChatGPT, Gemini, Perplexity), la part de voix vs concurrents, et les sources utilisées par les modèles sur nos thématiques.

Trafic et conversions depuis les LLMs – GA4 (ou Piano, Matomo…)
Même si le volume reste faible (< 1% du trafic total), c’est un indicateur de tendance à surveiller. Dans GA4, filtrer par source sur les user agents des LLMs connus (ChatGPT, Perplexity, etc.) pour isoler ce trafic et mesurer son évolution mois après mois.

Volume de recherche de marque – Ahrefs
Un proxy indirect mais fiable. Quand une marque est régulièrement citée dans les LLMs, les utilisateurs finissent par la rechercher nommément sur Google. Une hausse du branded search est souvent le premier signal mesurable d’une bonne visibilité GEO.

Apparitions dans les AI Overviews – Ahrefs
Sur les mots-clés suivis, Ahrefs permet d’identifier quelles requêtes déclenchent une AI Overview et si la marque y est citée. C’est le lien direct entre GEO et performance SEO/CTR et l’argument le plus concret à mettre dans un reporting client.

Checklist pour définir et mettre en oeuvre une stratégie GEO

PHASE 1 - Avant de toucher quoi que ce soit : le diagnostic (J1 à J5)

1. Vérifier que les bots LLM peuvent crawler le site
Contrôler le robots.txt.Si GPTBot, ClaudeBot ou PerplexityBot sont bloqués dans le robots.txt → quick win immédiat, débloquer en priorité absolue avant toute autre action.

2. Mesurer l’exposition de la thématique aux AI Overviews
Lancer l’Analyse d’impact AI Overviews sur les thématiques principales du client. Ça calibre l’urgence et donne un premier argument chiffré pour le client.

3. Générer un premier diagnostic de visibilité LLM
Lancer l’AEO Grader HubSpot sur la marque : scores par LLM, part de voix vs concurrents, axes d’amélioration.

4. Construire le panel de prompts
Lister 10 à 20 prompts couvrant notoriété, comparaison, informationnel et transactionnel. Utiliser le Reddit FAQ Finder pour identifier les vraies questions du secteur.

5. Configurer le LLM Brand Tracker
Configurer le panel et ajouter 3 à 5 concurrents directs. Identifier : le client est-il cité, sur quels LLMs, et surtout quelles sources sont utilisées (= cibles prioritaires Earned Media).

6. Identifier les pages exposées aux AI Overviews
Croiser GSC + Ahrefs : pages à fort trafic sur requêtes AIO = priorité CRO.

PHASE 2 - Les actions Technique (Semaine 1-2)

7. Corriger les blocages de crawl LLM
Si des bots sont bloqués (trouvé en 1.) : modifier le robots.txt pour autoriser GPTBot, ClaudeBot, PerplexityBot, Gemini-bot.

8. Auditer et mettre en place les données structurées prioritaires
Dans cet ordre de priorité :

  • FAQPage sur toutes les pages avec une section FAQ → +28% de citations en moyenne
  • HowTo sur les contenus step-by-step → +24% de citations
  • Article avec dateModified sur tous les articles de blog
  • Organization sur la homepage
  • Product sur les pages produit (e-commerce)

Valider avec le Rich Results Test de Google.

PHASE 3 - Les actions Owned Media (Semaine 2 à 8)

9. Auditer les contenus existants avec Thot SEO
Sur les pages stratégiques (pages piliers, articles à fort trafic) : lancer un audit QBST via Thot SEO. Identifier les pages avec un score sémantique insuffisant, ce sont les premières à optimiser.

10. Optimiser les contenus existants avant d’en créer de nouveaux
Dans l’ordre :

  • Corriger le score sémantique QBST des pages piliers (termes du champ lexical attendu manquants)
  • Ajouter un signal temporel explicite dans le corps du texte : “Mis à jour en mars 2026”, “Données vérifiées en 2026”
  • Mettre à jour les chiffres, exemples, captures d’écran : le freshness bias récompense les vraies mises à jour
  • S’assurer que les informations clés sont dans le premier tiers de la page (zone 10-20% = peak de lecture des LLMs)
  • Supprimer les intros inutiles qui repoussent le contenu vers le bas

11. Identifier les trous sémantiques et planifier les nouveaux contenus
Utiliser les fan-out queries identifiées dans le LLM Brand Tracker (disponibles sur Gemini) pour repérer les angles non couverts. Chaque fan-out query sans page dédiée est un trou dans la raquette GEO.

Prioriser les contenus evergreen multi-intent : une page qui répond à 5 angles d’une thématique (qu’est-ce que c’est / comment choisir / quels sont les meilleurs / combien ça coûte / avis) sera citée sur bien plus de prompts qu’une page mono-intent.

12. Créer les nouveaux contenus
Deux approches selon la nature du panel de prompts issu du diagnostic.

Approche A, panel large ou non arrêté (cas standard)

Production classique via Thot SEO pour garantir le score sémantique. Format cible selon l’intention :

  • Informationnel : article de fond 5 000 mots minimum, structuré en silos avec maillage vers les pages satellites
  • Commercial : listicle ou guide comparatif (à faire référencer par des tiers plutôt qu’en auto-promo)
  • Transactionnel : pages produit/catégorie optimisées
  • Local/Nav : homepage et pages profil soignées

Approche B, panel court et arrêté : dispositif X+1 exact match

Si le client sait précisément sur quels prompts il veut être cité (liste arrêtée ≤ 15) et dispose d’une substance d’autorité réelle, déployer le dispositif X+1 exact match (section dédiée) plutôt que la production classique.

En résumé : X pages exact match (title = H1 = slug = prompt) + 1 page FAQ pivot agrégatrice + duplication EN de la page pivot + maillage croisé + cohérence factuelle stricte sur les 11 pages.

Production des pages toujours via Thot SEO pour le score sémantique.

PHASE 4 - Les actions Earned Media (Mois 2 à 6)

13. Cibler les sources citées par les LLMs pour le netlinking/RP
Reprendre la liste des sources identifiées en point 5. Ce sont les domaines sur lesquels concentrer les efforts de netlinking et de relations presse, pas les DA 80 génériques.

14. Stratégie Reddit
Lancer le Reddit FAQ Finder sur les thématiques du client → identifier les subreddits actifs et les questions récurrentes
Évaluer les threads existants : est-ce que la marque y est mentionnée ?
Si non : option 1 (commenter si les conditions sont réunies) ou option 2 (créer un thread plus complet, laisser maturer, glisser la mention)
Ne jamais mentionner la marque à froid dans un premier post

15. Stratégie YouTube
Lancer le YouTube Channel Exporter sur la chaîne du client et celles des concurrents → exporter dans Claude pour un audit stratégique
Si le client a une chaîne : définir un rythme de publication réaliste et des formats alignés sur les requêtes cibles
Si le client n’a pas de chaîne : identifier des créateurs YouTube actifs sur la thématique → outreach pour sponsoring ou review

16. S’assurer d’apparaître dans les listicles tiers
Identifier les “best of”, comparatifs et roundups sectoriels qui remontent dans les réponses LLM sur les requêtes commerciales du client. Outreach vers les éditeurs pour y figurer avec des éléments différenciants concrets (données, études, témoignages clients).

PHASE 5 - Piloter en continu

17. Mensuel : LLM Brand Tracker
Relancer le panel de prompts. Observer :

  • Est-ce que le taux de citation progresse ?
  • Est-ce que la part de voix vs concurrents évolue ?
  • Est-ce que les sources citées ont changé ? (signal d’opportunité Earned Media)

18. Mensuel : Ahrefs
Surveiller l’évolution du volume de recherche de marque (branded search) → proxy indirect de la visibilité LLM
Surveiller les apparitions dans les AI Overviews sur les mots-clés suivis

19. Mensuel : GA4
Isoler le trafic entrant depuis les LLMs (user agents ChatGPT, Perplexity, etc.), puis mesurer son évolution et son taux de conversion

20. Tous les 6 mois : audit freshness
Passer en revue les pages piliers. Mettre à jour les chiffres, exemples et captures d’écran. Rafraîchir le signal temporel dans le texte. Le freshness bias récompense les vraies mises à jour, pas les changements de date cosmétiques.

Vous avez un besoin d'accompagnement en GEO ?

Contactez nous !
Vous avez un besoin d'accompagnement en GEO ?