Noindex : Comprendre et utiliser la balise Noindex pour le SEO

Q: Qu'est-ce que la balise noindex et à quoi sert-elle ?

La balise noindex est une directive HTML placée dans la section d'une page web. Elle sert à indiquer aux moteurs de recherche de ne pas indexer la page, c'est-à-dire de ne pas l'afficher dans les résultats de recherche. Concrètement, le robot d'exploration peut toujours visiter et consulter le contenu de la page, mais il n'en gardera pas de trace dans son index. Cette balise meta robots est particulièrement utile pour masquer des pages techniques, des doublons ou des contenus à faible qualité sans avoir à les supprimer du site.

Q: Noindex empêche-t-il le crawl d'une page ?

Non. Le noindex n'empêche pas l'indexer une page au sens du crawl : les robots d'exploration continuent de visiter la page et de lire son code HTML. Ce qu'il empêche, c'est l'empêcher l'indexation dans la base de données du moteur de recherche. Pour bloquer le crawl lui-même, il faut utiliser la directive disallow dans le fichier robots.txt. Attention cependant : si une page est bloquée en robots.txt, le robot ne peut plus lire la balise noindex qu'elle contient, ce qui peut créer des comportements inattendus dans les SERP.

Guillaume Schlupp

Co-fondateur & CMO

Dernière mise à jour :

March 31, 2026

La balise noindex est une balise HTML pour indiquer aux moteurs de recherche de ne pas indexer, et masquer des pages des résultats de recherche.

‍

La balise noindex est l'un des outils les plus puissants — et les plus mal utilisés — du référencement technique. En tant qu'agence SEO Webflow, Synqro rencontre régulièrement des sites où des pages stratégiques sont masquées par erreur, ou au contraire des pages inutiles qui polluent l'index de Google. Comprendre ce qu'est le noindex, comment il fonctionne et quand l'utiliser est essentiel pour optimiser la visibilité de votre site dans les moteurs de recherche.

Qu'est-ce que la balise noindex ?

La balise noindex est une balise HTML de type meta robots, placée dans la section <head> du code source d'une page. Elle indique aux moteurs de recherche de ne pas inclure cette page dans leur index, et donc de ne pas l'afficher dans les résultats de recherche.

Concrètement, voici la syntaxe de base :<meta name="robots" content="noindex">

Cette directive s'adresse directement aux robots d'exploration (ou crawlers) des moteurs de recherche comme Google, Bing ou Yahoo. En effet, lorsqu'un robot visite une page et détecte cette balise dans le code HTML de la page, il enregistre l'instruction et n'indexe pas le contenu de la page.

Points clés à retenir :

La balise se place dans la section <head> du code HTML
Elle est lue et respectée par la majorité des robots d'exploration
Elle n'empêche pas le crawler de visiter la page, seulement de l'indexer
Elle peut être combinée avec d'autres métadonnées comme nofollow

Noindex vs disallow : deux approches distinctes pour bloquer l'indexation

On confond souvent noindex et disallow. Ces deux directives servent à empêcher les moteurs de recherche d'afficher certaines pages, mais leur fonctionnement est radicalement différent.

Le disallow, utilisé dans le fichier robots.txt, bloque l'accès des robots à une URL. En revanche, si Google ne peut pas accéder à la page, il ne peut pas non plus lire la balise noindex qu'elle contient. Par conséquent, une page bloquée en robots.txt peut paradoxalement rester dans l'index si elle a déjà été crawlée ou si des liens externes pointent vers elle.

Critère	Noindex	Disallow (robots.txt)
Emplacement	Balise meta dans le <head>	Fichier robots.txt
Empêche le crawl	Non	Oui
Empêche l'indexation	Oui	Pas garanti
Lisible par le robot	Seulement si la page est crawlable	Toujours
Usage recommandé	Pages à masquer des SERP	Pages à ne pas crawler

La règle est simple : pour bloquer l'indexation d'une page tout en permettant au robot de la lire, utilisez noindex. Pour économiser le budget de crawl, utilisez disallow.

Noindex et nofollow : quelle combinaison choisir ?

La balise meta robots accepte plusieurs valeurs combinables. Parmi les plus courantes, on trouve noindex et nofollow. Ces deux directives ont des effets distincts.

noindex : empêche l'indexation de la page
nofollow : demande aux robots de ne pas suivre les liens présents sur cette page

La combinaison noindex, nofollow est donc la plus restrictive. Elle indique à la fois de ne pas indexer la page et de ne pas transmettre d'autorité via les liens sortants. C'est une directive utile pour des pages de connexion, des espaces membres ou des pages temporaires.

En revanche, noindex, follow est une option souvent sous-estimée : elle empêche l'indexation tout en autorisant les robots à suivre les liens et à transmettre du PageRank vers d'autres pages du site. Autrement dit, la page reste utile pour la circulation du référencement interne même si elle n'apparaît pas dans les SERP.

Quand utiliser la balise noindex en SEO ?

C'est ici que la maîtrise du noindex en SEO prend tout son sens. Toutes les pages d'un site n'ont pas vocation à être indexées. En effet, certaines pages n'ont aucun intérêt pour les utilisateurs dans les résultats de recherche, ou peuvent activement nuire à votre référencement.

Les cas d'usage les plus fréquents pour utiliser noindex :

Les pages de recherche interne (résultats filtrés, tri par catégorie)
Les pages de pagination qui dupliquent partiellement le contenu
Les pages de mentions légales, CGU, politique de confidentialité
Les pages de connexion, de panier ou d'espace client
Les pages de contenu dupliqué ou de tests en cours de développement
Les fichiers PDF accessibles en ligne sans valeur SEO
Les pages à faible qualité créées automatiquement (tags, archives vides)

Par conséquent, appliquer noindex sur ces pages permet de concentrer l'autorité du site sur les pages qui méritent vraiment d'être indexées.

Noindex pour empêcher le duplicate content

Le duplicate content est l'un des problèmes les plus courants en SEO technique. Lorsque plusieurs pages présentent un contenu dupliqué — qu'il s'agisse de variations d'URL, de pages de canonique mal configurées ou de pagination — Google peut avoir du mal à identifier la version de référence.

Dans ce contexte, noindex peut être une solution complémentaire à la balise canonique. Concrètement, si une page existe pour des raisons techniques mais ne doit pas être indexée, appliquer noindex est plus fiable que de compter uniquement sur la balise canonique, que Google peut parfois ignorer.

À noter que noindex ne résout pas tous les problèmes de dupliquer le contenu. Une stratégie complète inclut :

La balise canonique pour signaler la version principale
Le noindex pour les variantes sans valeur éditoriale
Le disallow pour limiter le crawl des pages purement techniques
Une architecture de site claire, notamment dans un CMS comme Webflow

Les webmasters qui combinent ces approches obtiennent une indexation des pages bien plus propre et cohérente.

Comment implémenter noindex dans Webflow ?

Webflow facilite l'implémentation du noindex sans toucher directement au code source. La plateforme intègre nativement des options de gestion SEO au niveau de chaque page, ce qui est un avantage considérable pour les webmasters qui ne sont pas développeurs.

Dans Webflow, pour utiliser la balise noindex sur une page spécifique :

Aller dans les paramètres de la page concernée
Accéder à l'onglet "SEO Settings"
Cocher l'option "Exclude this page from search results"
Publier les modifications

Webflow génère automatiquement la balise <meta name="robots" content="noindex"> dans l'en-tête de la page. Cette fonctionnalité peut aussi être appliquée via les champs CMS pour plusieurs pages à la fois, notamment si vous gérez des collections de contenu dynamiques.

Il est également possible d'indexer une page ou de revenir en arrière à tout moment. C'est l'un des avantages de Webflow pour optimiser la gestion du référencement technique sans développement spécifique.

Les erreurs à éviter avec noindex

Maîtriser noindex implique aussi de savoir ce qu'il ne faut pas faire. Certaines erreurs peuvent pénaliser l'ensemble du site de manière silencieuse.

Erreurs fréquentes observées :

Appliquer noindex sur des pages stratégiques par accident (page d'accueil, pages de services)
Combiner noindex avec disallow dans robots.txt, ce qui empêche le robot de lire la directive
Oublier de retirer noindex après une mise en ligne (pages laissées en mode développement)
Utiliser noindex pour bloquer du contenu protégé par des droits d'auteur à la place d'une vraie protection d'accès
Confondre noindex et la suppression de page : la page reste accessible aux utilisateurs, elle n'est simplement pas référencée dans les SERP

Par conséquent, un audit régulier de l'URL structure et des balises robots du site est indispensable. Les robots d'exploration ne signalent pas d'erreur lorsqu'ils rencontrent un noindex : c'est au webmaster de vérifier que chaque directive est intentionnelle.

FAQ

Qu'est-ce que la balise noindex et à quoi sert-elle ?

La balise noindex est une directive HTML placée dans la section <head> d'une page web. Elle sert à indiquer aux moteurs de recherche de ne pas indexer la page, c'est-à-dire de ne pas l'afficher dans les résultats de recherche. Concrètement, le robot d'exploration peut toujours visiter et consulter le contenu de la page, mais il n'en gardera pas de trace dans son index. Cette balise meta robots est particulièrement utile pour masquer des pages techniques, des doublons ou des contenus à faible qualité sans avoir à les supprimer du site.

Noindex empêche-t-il le crawl d'une page ?

Non. Le noindex n'empêche pas l'indexer une page au sens du crawl : les robots d'exploration continuent de visiter la page et de lire son code HTML. Ce qu'il empêche, c'est l'empêcher l'indexation dans la base de données du moteur de recherche. Pour bloquer le crawl lui-même, il faut utiliser la directive disallow dans le fichier robots.txt. Attention cependant : si une page est bloquée en robots.txt, le robot ne peut plus lire la balise noindex qu'elle contient, ce qui peut créer des comportements inattendus dans les SERP.

Peut-on utiliser noindex sur un site Webflow ?

Oui, et c'est même l'une des forces de Webflow. La plateforme permet d'appliquer noindex directement depuis l'interface, sans modifier le code source manuellement. Pour chaque page ou élément de collection CMS, il est possible d'activer l'option d'exclusion des moteurs de recherche en quelques clics. Les autres métadonnées SEO sont également gérables depuis cet espace. Chez Synqro, nous configurons systématiquement ces paramètres lors de chaque mise en ligne pour garantir une indexation des pages cohérente et maîtrisée. Si vous souhaitez un audit SEO technique de votre site, contactez notre équipe SEO.