Pourquoi mon site a 33 impressions mais 0 clic en 28 jours ?

Un taux de clic nul suggère soit que vos snippets (titre + méta-description) ne sont pas convaincants, soit que Google doute de la pertinence de vos pages. Vérifiez dans Google Search Console le CTR par requête et ajustez vos métadonnées pour mieux refléter la réalité de votre expertise.

Comment créer un sitemap XML fonctionnel pour Google ?

Le sitemap XML doit lister vos URLs principales avec lastmod et priority. Utilisez un outil comme XML Sitemaps ou générateur PS natif, validez la structure auprès de Google Search Console, puis soumettez via robots.txt (Sitemap: https://...).

Faut-il bloquer mon CRM et mon Hub admin dans robots.txt ?

Oui, absolument. Bloquer User-agent: * sur /crm/* et /admin/* économise votre crawl budget pour le contenu public valorisé, et évite de noyer vos logs de crawl. C'est une hygiène SEO basique.

Qu'est-ce qu'une balise canonical et pourquoi elle est importante ?

La canonical indique à Google quelle version d'une page est la « principale » (ex: /produit vs /produit?sort=prix). Sans elle, Google duplique son crawl et divise votre autorité. C'est surtout critique pour e-commerce avec filtres/paramètres.

Comment optimiser le crawl budget de mon site ?

Réduisez les redirects inutiles, bloquez les pages sans valeur (filtrages e-commerce, pages admin), activez la compression, et minimisez les 404. Chaque URL que Googlebot crawle mais ne peut indexer est du budget perdu.

Quelle différence entre noindex dans robots.txt et noindex meta ?

robots.txt empêche le crawl, meta noindex empêche l'indexation. Préférez meta noindex pour les pages non-contenu (CRM, filtres temporaires) : Google peut lire le tag, mais pas crawler l'intérieur. robots.txt gagne du temps.

Comment vérifier que Googlebot accède réellement à mes pages ?

Utilisez Google Search Console > Inspection des URL ou le rapport « Couverture ». Vous verrez si Google a crawlé, indexé ou rejeté chaque page, avec raison. Simulez aussi un fetch en tant que Googlebot pour vérifier le rendu.

Est-ce que les erreurs 404 tuent mon classement SEO ?

Les 404 isolées n'impactent pas votre ranking, mais créent une expérience utilisateur pauvre. Pour les anciennes URLs structurelles, préférez une 301 vers une page similaire ou une 410 (page supprimée volontairement) plutôt qu'une 404 perpétuelle.

Combien d'URLs maximum dans un sitemap ?

Maximum 50 000 URLs et 50 Mo par fichier sitemap. Au-delà, découpez en plusieurs fichiers et créez un sitemap d'index (sitemap_index.xml) qui en liste les références. Google traite mieux les sitemaps fragmentés.

Comment bloquer les pages admin du crawl sans robots.txt ?

Utilisez meta noindex + nofollow sur le template admin, et X-Robots-Tag header côté serveur. Pour une sécurité maximale, combinez : robots.txt (bloque) + noindex meta (failsafe) + authentication (empêche l'accès).

Canonical ou redirect 301 pour éliminer les doublons ?

301 redirect si l'ancienne URL disparaît vraiment. Canonical si les deux URLs existent (ex: version http ET https, paramètres de session). Redirects coûtent du crawl ; canonicals sont « gratuites ».

Mon site est indexé mais ne s'affiche pas en recherche, pourquoi ?

C'est un problème de ranking, pas d'indexation. Vérifiez votre positionnement réel (GSC, tools SEO tiers), analysez la compétition pour vos mots-clés, et optimisez la richesse sémantique et l'autorité de domaine de vos pages.

Dois-je mettre à jour mon sitemap chaque fois que je publie ?

Pas obligatoire si votre plateforme généère automatiquement le sitemap. Mais idéalement, publiez + mettez à jour lastmod + Re-soumettez via Search Console tous les 3-7 jours pour accélérer l'indexation des contenus neufs.

Comment vérifier que mon robots.txt fonctionne correctement ?

Dans Google Search Console > Outils > Testeur robots.txt, saisissez une URL et Googlebot-image pour simuler le crawl. Vérifiez aussi qu'aucune directive contradictoire ne bloque par erreur vos pages publiques.

Les Core Web Vitals impactent-ils l'indexation ou juste le ranking ?

Juste le ranking, pas l'indexation. Un site lent est indexé normalement mais classé plus bas sur mobile. Optimisez : LCP < 2,5s, CLS < 0,1, FID < 100ms. C'est un signal de classement confirmé depuis 2021.

seo

Infrastructure SEO : bâtir une relation intime avec Googlebot

Comment j'ai construit un système SEO complet en une matinée : sitemap dynamique, bot tracking, Indexing API, canonical. Récit avec chiffres réels.

8 min de lecture

Partager LinkedIn Facebook

Ce matin, à 5 heures, en ouvrant Google Search Console, j'ai découvert un tableau de bord humiliant : 33 impressions, 0 clic en 28 jours. Mon site — celui d'un consultant e-commerce facturé 950 euros par jour — était invisible. Pas parce que le contenu manquait. 190 articles d'expertise dormaient dans la base, absents du sitemap. Le sitemap, justement, contenait 19 t-shirts et mugs de démonstration PrestaShop. Aucune balise canonical. Un robots.txt grand ouvert qui laissait les crawlers indexer le CRM et le Hub d'administration. En trois heures, j'ai reconstruit l'intégralité de l'infrastructure SEO. Voici exactement ce que j'ai fait, pourquoi, et ce que ça change concrètement.

L'état des lieux : ce que les bots voyaient vraiment

Problème	Impact concret	Risque SEO
Sitemap PrestaShop avec URLs `/accueil/`	Mauvais routing, pages introuvables par les bots	Crawl budget gaspillé sur des 404
19 produits démo (t-shirts, mugs) dans le sitemap	Google indexe du contenu fictif sur un site de consultant	Confusion sémantique, perte de crédibilité thématique
0 balise canonical sur tout le site	Contenu dupliqué potentiel entre variantes d'URL	Dilution du PageRank, pénalité algorithmique
robots.txt ne bloquant rien	/hub/, /crm/, /api/ crawlés par tous les bots	Exposition de pages privées, bruit dans l'index
190+ articles absents du sitemap	Google ne sait pas que ces pages existent	Contenu invisible, trafic organique à zéro
33 impressions, 0 clic en 28 jours	Aucune visibilité dans les SERP	Cercle vicieux : pas de clic → pas de signal → pas de position

Le diagnostic était limpide. Le site n'avait pas un problème de contenu — il avait un problème d'infrastructure. Google ne pouvait pas trouver ce qu'il cherchait parce que personne ne lui avait expliqué où regarder.

9 chantiers en une matinée

Voici la séquence exacte des travaux, dans l'ordre où je les ai réalisés. Chaque chantier a été committé, déployé et vérifié avant de passer au suivant.

Optimisation des URLs — 11 slugs refondus
J'ai identifié 11 pages dont les slugs contenaient des stop words inutiles (le, de, pour, et) ou des doublons de catégorie. Par exemple, /blog/seo/seo-technique-ecommerce-guide-complet-pour-les-dirigeants est devenu /blog/seo/technique/seo-technique-ecommerce-guide-dirigeants. Plus court, plus lisible, plus efficace. Chaque ancienne URL a reçu une redirection 301 permanente pour conserver le jus SEO existant — même s'il était quasi nul, c'est un réflexe non négociable.
Sitemap dynamique Nuxt — 3 sous-sitemaps
Le sitemap statique généré par PrestaShop a été remplacé par un sitemap dynamique côté Nuxt. Trois sous-sitemaps distincts : pages institutionnelles, articles de blog, et pages d'expertise. Chaque sous-sitemap est généré à la volée, avec les dates de dernière modification réelles. Le sitemap PrestaShop avec ses t-shirts de démo a été supprimé définitivement.
Canonical automatique — plugin Nuxt
Un plugin Nuxt injecte automatiquement <link rel="canonical"> et og:url sur chaque page du site. Plus besoin d'y penser : toute nouvelle page publiée reçoit sa canonical sans intervention humaine. C'est la seule façon de garantir que Google sait quelle URL est la version de référence.
robots.txt intelligent
Le nouveau robots.txt bloque explicitement /crm/, /hub/, /api/, /module/ et /img/. Seul le contenu public reste accessible aux crawlers. C'est une règle de base que beaucoup d'architectures headless négligent : quand le back-office et le front partagent le même domaine, il faut tracer une frontière nette entre ce qui est public et ce qui ne l'est pas.
Bot tracker — middleware de traçabilité
Un middleware Nuxt identifie et enregistre le passage de plus de 30 bots connus : Googlebot, Bingbot, mais aussi GPTBot (OpenAI), ClaudeBot (Anthropic), Bytespider (TikTok), Amazonbot, et d'autres. Chaque visite est horodatée avec l'URL crawlée, le user-agent complet et l'adresse IP. Le résultat est consultable en temps réel depuis le Hub.
Google Indexing API — notification en 30 secondes
Plutôt que d'attendre que Googlebot découvre une nouvelle page en explorant le sitemap (ce qui peut prendre des jours, voire des semaines), l'Indexing API notifie Google immédiatement après chaque publication. Un service account Google Cloud, un fichier JSON de credentials, et un appel HTTP POST. En 30 secondes, Google sait qu'une nouvelle page existe. Selon la documentation Google Search Central, l'Indexing API est le moyen le plus rapide de signaler du contenu nouveau ou mis à jour.
IndexNow — Bing, Yandex, DuckDuckGo
Le protocole IndexNow fait la même chose que l'Indexing API, mais pour Bing, Yandex et tous les moteurs qui supportent le standard. Un seul ping, et quatre moteurs de recherche sont informés simultanément. Le coût technique est négligeable : un POST HTTP avec une clé API.
Dashboard SEO Monitor
Toutes ces données — passages de bots, URLs crawlées, notifications d'indexation — sont agrégées dans un tableau de bord accessible depuis /hub/seo-monitor. On voit en un coup d'oeil qui crawle quoi, à quelle fréquence, et quelles pages n'ont jamais été visitées par un bot.
Google Search Console connectée
Un service account Google Cloud est branché sur Search Console via l'API. Les données de performance (impressions, clics, position moyenne, CTR) remontent automatiquement dans le Hub. Plus besoin d'ouvrir GSC manuellement pour suivre l'évolution.

Avant / Après : la comparaison

Dimension	Avant (ce matin 5h)	Après (ce matin 8h)
Sitemap	Statique, 19 produits démo, 0 article	Dynamique, 3 sous-sitemaps, 190+ articles
Canonical	Aucune balise sur le site	Automatique sur chaque page
robots.txt	Permissif — tout est crawlable	Restrictif — seul le contenu public est visible
Notification d'indexation	Aucune — on attend que Google passe	Indexing API + IndexNow en 30 secondes
Visibilité sur les bots	Aucune — on ne sait pas qui crawle	30+ bots trackés en temps réel
Données structurées	Aucun JSON-LD	Article, FAQPage, BreadcrumbList sur chaque page
Temps de mise en place	—	3 heures (5h → 8h)

La philosophie derrière l'infrastructure

Ces neuf chantiers ne sont pas une liste de bonnes pratiques piochées dans un guide SEO. Ils répondent à une philosophie précise, que j'applique à chaque instance CodeMyShop que je déploie :

Ne pas attendre que Google vienne — aller le chercher. L'Indexing API et IndexNow inversent la relation. Au lieu de publier et d'espérer, on notifie et on mesure. La différence entre un site passif et un site actif, c'est la vitesse d'indexation.
Savoir exactement ce que les bots voient. Le bot tracker transforme une boîte noire en tableau de bord transparent. On ne peut pas optimiser ce qu'on ne mesure pas. Et la plupart des sites ne mesurent rien côté crawl.
Chaque page a une seule URL. La balise canonical élimine toute ambiguïté. C'est trivial à implémenter, mais la majorité des sites headless l'oublient — parce que ni le front ni le back ne s'en sentent responsable.
Le contenu privé est invisible. Un robots.txt bien configuré, c'est un mur entre l'espace public et l'espace d'administration. Quand le CRM, le Hub et l'API partagent le même domaine, ce mur est vital.
Les données structurées parlent aux machines. JSON-LD (Article, FAQPage, BreadcrumbList) n'est pas un bonus cosmétique. C'est le langage que Google, Bing et les IA utilisent pour comprendre une page. Un article sans JSON-LD est un article muet.

Ce que ça change pour un dirigeant e-commerce

Si vous gérez une boutique en ligne, voici ce que cette infrastructure signifie concrètement pour votre business. Chaque page publiée est immédiatement signalée aux moteurs de recherche. Chaque URL est propre, canonique, et présente dans un sitemap à jour. Chaque bot qui visite votre site est identifié et tracé. Et chaque donnée de performance remonte automatiquement dans votre tableau de bord.

Ce n'est pas du SEO « technique pour le plaisir de la technique ». C'est du SEO structurel : poser les fondations pour que chaque contenu publié ait une chance réelle d'être indexé, classé et trouvé. Sans cette infrastructure, même le meilleur article du monde reste invisible.

Cette infrastructure est intégrée nativement dans chaque instance CodeMyShop. Quand je déploie une boutique pour un client, ces neuf chantiers sont opérationnels dès le premier jour. Le client ne s'en occupe pas — il publie du contenu, et le système fait le reste.

Source d'autorité : La documentation officielle de Google Search Central sur les sitemaps confirme qu'un sitemap bien structuré est le moyen le plus fiable de signaler des URLs nouvelles ou mises à jour. Google recommande explicitement les sous-sitemaps pour les sites de plus de 50 000 URLs, et déconseille d'inclure des URLs non canoniques.

Conclusion : l'infrastructure invisible qui fait toute la différence

En trois heures, ce site est passé d'un état où Google ne savait même pas qu'il existait à un état où chaque publication est signalée en 30 secondes, chaque page a sa canonical, et chaque visite de bot est tracée. Les 190 articles qui dormaient dans la base sont maintenant dans le sitemap. Les 19 t-shirts de démo ont disparu. Et le robots.txt protège enfin l'espace privé.

Les résultats ne seront pas immédiats — Google a besoin de 4 à 8 semaines pour recrawler, réévaluer et repositionner un site. Mais les fondations sont posées. Et contrairement à une campagne publicitaire qui s'arrête quand on coupe le budget, le trafic organique se cumule. Chaque article indexé travaille en permanence, 24 heures sur 24.

C'est exactement cette approche que j'applique à chaque projet e-commerce que je prends en charge.

Vous voulez que votre site parle couramment le langage des bots ?
Réserver un appel découverte

Sources :

Google Search Central (2026). Sitemaps overview. developers.google.com — Documentation officielle sur la structure et les bonnes pratiques des sitemaps.
Google Search Central (2026). Indexing API Quickstart. developers.google.com — Guide d'implémentation de la notification d'indexation temps réel.
Microsoft Bing (2025). IndexNow Protocol. indexnow.org — Spécification du protocole de notification multi-moteurs.
Google Search Central (2026). Consolidate duplicate URLs. developers.google.com — Recommandations sur l'implémentation des balises canonical.

Approfondir dans l'Academy

Module : SEO Technique : la machine à être trouvé →

Articles dans le même univers

Questions fréquentes

Tout ce que vous devez savoir sur ce sujet.

: Un taux de clic nul suggère soit que vos snippets (titre + méta-description) ne sont pas convaincants, soit que Google doute de la pertinence de vos pages. Vérifiez dans Google Search Console le CTR par requête et ajustez vos métadonnées pour mieux refléter la réalité de votre expertise.
: Le sitemap XML doit lister vos URLs principales avec lastmod et priority. Utilisez un outil comme XML Sitemaps ou générateur PS natif, validez la structure auprès de Google Search Console, puis soumettez via robots.txt (Sitemap: https://...).
: Oui, absolument. Bloquer User-agent: * sur /crm/* et /admin/* économise votre crawl budget pour le contenu public valorisé, et évite de noyer vos logs de crawl. C'est une hygiène SEO basique.
: La canonical indique à Google quelle version d'une page est la « principale » (ex: /produit vs /produit?sort=prix). Sans elle, Google duplique son crawl et divise votre autorité. C'est surtout critique pour e-commerce avec filtres/paramètres.
: Réduisez les redirects inutiles, bloquez les pages sans valeur (filtrages e-commerce, pages admin), activez la compression, et minimisez les 404. Chaque URL que Googlebot crawle mais ne peut indexer est du budget perdu.
: robots.txt empêche le crawl, meta noindex empêche l'indexation. Préférez meta noindex pour les pages non-contenu (CRM, filtres temporaires) : Google peut lire le tag, mais pas crawler l'intérieur. robots.txt gagne du temps.
: Utilisez Google Search Console > Inspection des URL ou le rapport « Couverture ». Vous verrez si Google a crawlé, indexé ou rejeté chaque page, avec raison. Simulez aussi un fetch en tant que Googlebot pour vérifier le rendu.
: Les 404 isolées n'impactent pas votre ranking, mais créent une expérience utilisateur pauvre. Pour les anciennes URLs structurelles, préférez une 301 vers une page similaire ou une 410 (page supprimée volontairement) plutôt qu'une 404 perpétuelle.
: Maximum 50 000 URLs et 50 Mo par fichier sitemap. Au-delà, découpez en plusieurs fichiers et créez un sitemap d'index (sitemap_index.xml) qui en liste les références. Google traite mieux les sitemaps fragmentés.
: Utilisez meta noindex + nofollow sur le template admin, et X-Robots-Tag header côté serveur. Pour une sécurité maximale, combinez : robots.txt (bloque) + noindex meta (failsafe) + authentication (empêche l'accès).
: 301 redirect si l'ancienne URL disparaît vraiment. Canonical si les deux URLs existent (ex: version http ET https, paramètres de session). Redirects coûtent du crawl ; canonicals sont « gratuites ».
: C'est un problème de ranking, pas d'indexation. Vérifiez votre positionnement réel (GSC, tools SEO tiers), analysez la compétition pour vos mots-clés, et optimisez la richesse sémantique et l'autorité de domaine de vos pages.
: Pas obligatoire si votre plateforme généère automatiquement le sitemap. Mais idéalement, publiez + mettez à jour lastmod + Re-soumettez via Search Console tous les 3-7 jours pour accélérer l'indexation des contenus neufs.
: Dans Google Search Console > Outils > Testeur robots.txt, saisissez une URL et Googlebot-image pour simuler le crawl. Vérifiez aussi qu'aucune directive contradictoire ne bloque par erreur vos pages publiques.
: Juste le ranking, pas l'indexation. Un site lent est indexé normalement mais classé plus bas sur mobile. Optimisez : LCP < 2,5s, CLS < 0,1, FID < 100ms. C'est un signal de classement confirmé depuis 2021.

Une question ?

Contactez-nous directement.

contact@alexandrecarette.fr ← Tous les articles

Discussion

Cluster Sémantique

Voir tous les articles

seo

Stratégie de contenu SEO e-commerce : méthode complète pour 2026

Stratégie de contenu SEO e-commerce : méthode en 5 étapes pour générer du trafic organique durable sur PrestaShop. Audit, silos, mots-clés, calendrier et ROI.