Grâce à la data, votre site sait déjà où va l’utilisateur 

03 juin 2026
Julien Coquet

Chaque transition de page repart de zéro.

Le navigateur charge les ressources, effectue un rendu de l’HTML, exécute le code JavaScript, etc. Peu importe que l’utilisateur ait visité ce même chemin cent fois dans la journée. Pourtant, vos données de navigation GA4 dessinent déjà une carte précise des intentions des internautes: quelle page sera chargée après, à quelle fréquence, et sur quel type d’appareil. Cette étude exploite ces données pour précharger silencieusement les cinq pages les plus probables via des balises prefetch, pilotées par GTM et alimentées par un modèle entraîné dans BigQuery.

Résultat : une navigation perçue comme instantanée, sans modifier le code du site, et un impact mécanique sur la conversion.

Le problème que personne ne mesure

Les scores Core Web Vitals d’un site e-commerce peuvent être excellents sur la page d’accueil et catastrophiques sur les pages catégories. C’est précisément là que les utilisateurs décident d’aller plus loin ou de partir.

L’indicateur LCP (Largest Contentful Paint) mesuré sur la première page d’une session en dit peu sur l’expérience réelle de navigation. Ce qui compte pour un acheteur en cours de session, c’est la vitesse de la deuxième page, de la troisième, c’est-à-dire les pages qu’il n’a pas encore chargées, mais qu’il chargera dans les trente prochaines secondes.

Un client e-commerce généraliste (500 000 sessions mensuelles, catalogue de 8 000 références) nous soumet exactement ce problème. Ses scores Lighthouse sont corrects. Son taux de rebond sur navigation interne est pourtant de 34 %, avec une chute de 12 points du taux de conversion entre la deuxième et la troisième page consultée. Le problème n’est pas le contenu mais la friction perçue lors du chargement.

Il faut donc se poser la question : peut-on anticiper là où va l’utilisateur et charger les ressources avant même qu’il clique sur le lien vers la page d’après ?

La mécanique du prefetch

La méthode prefetch est une directive HTML native. Ajouter <link rel=”prefetch” href=”/page-cible”> dans le <head> d’une page indique au navigateur de télécharger cette ressource en arrière-plan, avec la priorité la plus basse, pendant les temps morts de la session. Quand l’utilisateur clique effectivement vers cette page, le contenu est déjà dans le cache du navigateur. Le chargement perçu devient quasi instantané et fluidifie le parcours client, ce qui va mécaniquement faciliter le chemin de l’internaute vers la conversion.

prefetch n’est pas une méthode ni récente ni révolutionnaire mais elle est surtout utilisée pour précharger des ressources de type JavaScript, vidéo, et autres éléments plus lourds.

La difficulté n’est pas technique mais décisionnelle : quelles cinq pages précharger ? Précharger les mauvaises pages consomme de la bande passante inutilement et peut même nuire aux performances en saturant la connexion réseau et en alourdissant la charge du serveur Web.

C’est là qu’intervient le modèle de données de navigation vers les pages suivantes.

Comment ça marche : GA4, GCP et GTM

Étape 1 : extraction des séquences de navigation depuis BigQuery

Si vous avez configuré un export de vos données GA4 vers BigQuery, chaque événement page_view est horodaté, puis rattaché à une session, et enfin rattaché à un utilisateur. On peut ainsi reconstruire, session par session, l’ordre exact des pages visitées. On peut donc construire une table de transitions qui contient, pour chaque URL d’origine, la liste des destinations observées et leur fréquence relative.

Étape 2 : entraînement du modèle de prédiction

Pour un catalogue de 8 000 références produit, une simple table de fréquences suffit rarement. Les pages peu visitées ont des statistiques instables. Les promotions temporaires faussent les fréquences et autres tendances. 

On entraîne un modèle de recommandation de séquences directement dans BigQuery ML, en enrichissant les données de navigation de variables contextuelles : catégorie de page, heure de visite, type d’appareil, profondeur de session. 

Le résultat est une table de prédictions actualisée chaque nuit et qui contient, pour chaque URL canonique, les cinq destinations les plus probables avec leur score de confiance. Un pipeline Cloud Scheduler déclenche le ré-entraînement du modèle automatiquement et mesure la précision (top-5 accuracy) avant de pousser les nouvelles prédictions en production.

Étape 3 : Cloud Function comme couche d'accès

Une Cloud Function HTTP (déployée sur GCP, région europe-west9 pour une meilleure empreinte carbone) expose ces prédictions via une API simple : on lui passe l’URL courante, elle retourne les cinq pages les plus probables. La Cloud Function lit les résultats depuis un cache Firestore (alimenté depuis BigQuery). On pourrait en dire plus sur la performance pure de cette méthode mais ca sera pour une autre étude.

Étape 4 : injection de prefetch via Google Tag Manager

Dans Google Tag Manager, on déclenche une balise Custom HTML sur chaque événement page_view. Ou sur un autre événement d’initialisation de la page ou du DOM. La balise appelle la Cloud Function avec l’URL courante, récupère la liste des pages probables, puis injecte dynamiquement les balises <link rel=”prefetch”> correspondantes dans le <head> de la page. Côté mesure, deux événements GA4 sont envoyés : prefetch_insertion quand les balises sont posées, et prefetch_clic quand l’utilisateur navigue effectivement vers une des URLs préchargées. Ce second événement permet de calculer la précision réelle du modèle en conditions de production, session après session.

Vous n’avez pas besoin de modifier votre site : c’est GTM qui gère l’intégralité du déploiement.

Voici un schéma récapitulatif de cette méthodologie:


Cliquez sur le visuel

Mesure de l'impact de prefetch

Avant tout déploiement en production, un test A/B est mis en place via GTM : 50 % des sessions reçoivent les balises prefetch, 50 % naviguent normalement. Le groupe d’appartenance est tiré au sort côté client (client ID pair ou impair) et stocké dans un cookie first-party, ce qui garantit la cohérence de l’expérience sur l’ensemble de la session.

Les indicateurs suivis pendant la phase de test (4 semaines, 200 000 sessions) :

Indicateur Groupe contrôle Groupe prefetch Variation
LCP moyen (2e page visitée) 3,2 s 1,4 s -56%
Taux de rebond inter-pages 34 % 21% -38%
Pages vues par session 3,1 4,4 +42%
Taux de conversion 2,8 % 3,6% +29%
Précision du modèle (top-5)
-
73%
-

Cliquez sur le visuel

La réduction du LCP sur la deuxième page est spectaculaire parce que le navigateur n’a plus à télécharger le HTML principal ni les images above-the-fold : tout est déjà en cache local.


Cliquez sur le visuel

Le gain de conversion (+29 %) s’explique par une combinaison de facteurs. La fluidité de navigation réduit la frustration et maintient l’intention d’achat. Les pages préchargées incluent systématiquement la page panier, ce qui raccourcit le chemin vers la conversion pour les utilisateurs déjà décidés.

Ce que le modèle apprend que les analytics ne montrent pas

Un résultat inattendu de ce projet : les prédictions du modèle divergent souvent de ce que l’équipe métier anticipait.

Sur la catégorie “chaussures de sport”, l’intuition initiale était que les utilisateurs consultaient d’abord les best-sellers puis filtraient par prix. Le modèle révèle que 41 % des sessions passent d’abord par le guide d’achat, avant toute page produit. Ces sessions convertissent 2,3 fois plus que la moyenne.

La page du guide d’achat était peu investie éditorialement. Elle devient une priorité de la roadmap contenu.

Le prefetch n’est pas qu’un levier de performance technique. C’est un révélateur de l’intention réelle des utilisateurs, que les rapports d’entonnoir standard ne montrent pas parce qu’ils n’analysent que les séquences vers la conversion, pas les séquences vers la décision.


Cliquez sur le visuel

Conditions de succès et limites

Ce type de projet fonctionne bien quand le catalogue est suffisamment profond (plus de 500 URLs uniques récurrentes) et quand le volume de sessions hebdomadaires dépasse 20 000. En dessous, les données d’entraînement sont trop peu denses pour que le modèle produise des prédictions stables.

Le prefetch a un coût réseau. Sur des connexions mobiles lentes ou des sessions très courtes (rebond immédiat), précharger cinq pages consomme de la bande passante sans bénéfice. Le tag GTM peut intégrer une condition sur le type de connexion via l’API Network Information (navigator.connection.effectiveType), ce qui désactive le prefetch sur les connexions 2G et 3G (si, si) faibles.

Enfin, le modèle doit être ré-entraîné régulièrement. Les gabarits de navigation évoluent avec les promotions, les saisons, les campagnes paid, etc. La précision du top-5 est surveillée dans un tableau de bord BigQuery. Si elle passe sous 60 %, une alerte déclenche un réentraînement forcé indépendamment du cycle quotidien.

En conclusion

L’accélération de la navigation ne passe pas toujours par l’optimisation du CDN ou la refonte du JavaScript. Elle passe parfois par une question plus simple : est-ce que vous utilisez ce que vos données vous disent déjà ?

GA4 enregistre chaque séquence de navigation. BigQuery permet de l’exploiter à l’échelle. Un modèle de prédiction transforme ces séquences en intentions. GTM déploie la réponse sans toucher au code source du site.

Le résultat ne se mesure pas seulement en millisecondes gagnées sur le LCP. Il se mesure en sessions prolongées, en pages vues supplémentaires, en paniers validés. Et accessoirement, en une compréhension plus fine de ce que vos utilisateurs cherchent vraiment quand ils naviguent sur votre site.

Vous souhaitez mieux exploiter vos données ?

Contactez nous !
Vous souhaitez mieux exploiter vos données ?

Ces articles peuvent vous intéresser

  • Data

La CMP m'a tuer

  • Data
  • SEO

Votre SEO disparaît dans GA4 avant même d'être mesuré