URL canoniques : le guide complet

Sommaire

Indispensable à toute stratégie SEO, L’élément de lien rel=”canonical”, souvent appelé URL canonique reste fréquemment sujet à des idées fausses courantes et utilisé de manière incorrecte, même par des référenceurs chevronnés qui sont dans l’industrie depuis un certain temps.

Alors, sans plus tarder, dans ce guide, examinons de près ce que sont les URL canoniques, comment les utiliser, quand les utiliser et plus encore…

Que sont les URL canoniques ?

url canonique

Une URL canonique est un élément de lien qui peut être utilisé pour indiquer aux moteurs de recherche que des URL spécifiques sont toutes liées à une page mère.

En bref, elles vous aident à spécifier la version d’une URL que vous souhaitez voir apparaître dans les résultats de recherche. Ceci est utile car, dans certains cas, lorsque vous avez du contenu accessible via plusieurs URL ou des sites Web entièrement différents, vous pouvez utiliser des URL canoniques pour éviter que le contenu dupliqué n’affecte négativement les classements.

Techniquement parlant, les URL canoniques sont simplement des balises de lien HTML qui utilisent l’attribut rel=canonical. En termes simples, voici comment fonctionnent les URL canoniques :

Une URL canonique est définie en plaçant ce que l’on appelle une balise canonique sur les pages. Les balises canoniques ne sont que des extraits de code HTML qui définissent la page principale/mère pour ces pages potentiellement dupliquées.

Une balise canonique elle-même est un extrait de code HTML utilisé pour définir quelles sont les principales versions des pages dupliquées ou similaires. Dans toute une gamme de scénarios (que nous couvrirons dans ce guide), où vous avez un contenu identique ou très similaire disponible sous différentes URL, des balises canoniques doivent être utilisées pour spécifier quelle version est la version principale (ou la version principale ) et devrait donc être indexé par les moteurs de recherche (comme Google)…

Pourquoi les URL canoniques sont-elles importantes ?

Maintenant que vous savez ce que sont les balises et les URL canoniques, examinons pourquoi elles sont importantes et vous devriez commencer à envisager de définir différentes URL canoniques pour certains articles et pages de vos sites Web.

Comme vous vous en doutez, Google n’est pas fan du contenu dupliqué, principalement parce qu’il leur est plus difficile de classer les pages. Autrement dit:

Comment Google doit-il savoir quelle version d’une page indexer puis classer, et comment répartir “l’équité des liens” ?

Trop de contenu dupliqué peut également affecter votre « budget de crawl ». Cela signifie que Google peut finir par perdre du temps à explorer plusieurs versions de la même page plutôt que d’autres contenus importants sur votre site Web.

REMARQUE IMPORTANTE
Les balises canoniques ne sont en fait pas nouvelles. Bien qu'il soit possible que certaines personnes n'aient pas rencontré ce concept (jusqu'à présent !), les balises canoniques ont en fait été introduites en 2009.

Trop de doublons, ainsi que trop de contenu de mauvaise qualité, n’est évidemment pas bon pour votre site Web.

Pourquoi voudriez-vous que Google perde du temps à explorer plusieurs versions d’une même page au lieu de se concentrer sur les pages importantes de votre site ?

Si les nouvelles pages ont tendance à être crawlées le jour même de leur publication, le budget de crawl n'est pas quelque chose sur lequel les webmasters doivent se concentrer. De même, si un site compte moins de quelques milliers d'URL, la plupart du temps, il sera exploré efficacement.
(source: Blog Google Webmaster )

Bien que Google affirme que ce n’est généralement pas un problème, l’utilisation de balises canoniques peut remédier à tous ces problèmes potentiels, car elles vous permettent non seulement d’indiquer [à Google] quelle version d’une page doit être indexée, mais également où l’équité du lien ( familièrement appelé « link juice ») devrait être consolidé.

Définition des URL canoniques pour les publications et les pages WordPress

Avec les différents plugin SEO qui existent pour WordPress et Woocommerce, la gestion des urls canoniques devient simple;

Le plugin Rank Math SEO WordPress facilite la modification de l’URL canonique à l’aide de la méta-boîte (comme illustré ci-dessous).

rank Math SEO plugin

Par défaut, Rank Math utilise l’URL actuelle de la publication/page comme URL canoniques, vous n’avez donc qu’à modifier ce paramètre si vous souhaitez le remplacer par autre chose.

idem pour le plugin Yoast SEO, qui vous permet de renseigner l’url canonique

Yoast SEO

Rank Math URL canonique WordPress

Ceci est également connu sous le nom de canonique auto-référencé, que nous aborderons plus tard avec tous les autres scénarios dans lesquels la canonisation est bénéfique.

Configuration manuelle des URL canoniques (avancé)

Si votre site Web ne tire pas actuellement parti du système de gestion de contenu WordPress qui alimente actuellement plus de 40 % de tous les sites Web sur Internet, y compris des sites comme CNN, Bloomberg et plus, voici comment vous pouvez définir manuellement des URL canoniques pour les pages de votre site Web. …

Ainsi, comme mentionné précédemment, une URL canonique est simplement définie en utilisant l’attribut de lien HTML rel=”canonical”. Par conséquent, pour en définir un sur n’importe quelle page d’un site Web, ajoutez simplement le code suivant dans la section du code source HTML d’une page Web :

<link rel="canonical" href="https://votresite.com/nom-page/">

Et puis, remplacez simplement https://votresite.com/nom-page/ par l’URL que vous souhaitez définir comme URL canonique pour la page à laquelle vous avez ajouté le code ci-dessus.

Quand devez-vous utiliser des URL canoniques ?

Redirections 301 vs utilisation de rel=canonical

Vous ne savez pas s’il serait plus logique d’implémenter une redirection ou d’utiliser la canonisation ? La façon la plus simple de le faire est:

S’il est possible d’utiliser des redirections pour résoudre le problème, utilisez une redirection. Cependant, utilisez des URL canoniques si vous souhaitez toujours que les deux versions de la page soient accessibles (mais pas dans les résultats de recherche) et qu’il ne serait tout simplement pas possible d’utiliser des redirections pour que cela se produise. En d’autres termes, si une page Web est identique ou presque dupliquée et ne sert à rien d’autre en étant accessible à Internet (c’est-à-dire aux utilisateurs de votre site ou aux moteurs de recherche), alors redirigez-la simplement vers celle que vous considérez comme une priorité.

Et lorsque cela n’est pas possible parce que les deux pages ont toujours un objectif valable et précieux en étant accessibles, utilisez une URL canonique pour spécifier laquelle des pages connexes vous préférez que les moteurs de recherche considèrent comme la page d’origine/mère.

Les pages ont-elles besoin d’une URL canonique d’auto-référence ?

Dans l’image de la Rank Math SEO Meta Box qui est apparue plus tôt dans cet article, nous n’avons pas lié une autre page en insérant une URL, mais l’URL canonique a été définie sur la page actuelle elle-même.

Il est fortement recommandé d’avoir les éléments de lien rel=canonical sur toutes les pages principalement parce que cela a été adopté comme une meilleure pratique depuis que Google a confirmé que c’est la meilleure façon de le gérer.

L’effet secondaire potentiel de ne pas avoir d’URL canoniques auto-référencées sur les pages qui pointent vers la version simple de l’URL se heurte à des erreurs de contenu en double. C’est pourquoi l’ajout d’un canonique d’auto-référencement aux URL est une bonne pratique, et vous serez ravi d’apprendre que le plugin tel que Rank Math SEO, Yoast SEO ou ALL In One SEO le fassent déjà, vous n’avez donc pas à vous en soucier.

La plupart des gens supposent que leur site Web n’a pas de contenu en double, car ils n’ont évidemment pas publié le même contenu à plusieurs reprises à dessein. Cela étant dit, ce n’est pas nécessairement vrai, car les moteurs de recherche explorent des URL individuelles, et non des pages de votre site Web.

Oui, cela signifie vraiment qu’ils verraient votresite.com/blog/seo et votresite.com/blog/seo?id=123 comme des pages uniques bien qu’il s’agisse de la même page réelle avec un contenu très similaire ou exactement le même .

https://votresite.com/blog/seo/
https://votresite.com/blog/seo/?utm_source=active%20users&utm_medium=email
http://votresite.com/wordpress/seo/?utm_medium=twitter

Les URL avec des chaînes de requête telles que celles illustrées ci-dessus sont appelées URL paramétrées et peuvent causer des problèmes de contenu en double sur les sites Web, en particulier ceux qui permettent le filtrage, tels que les sites Web d’e-commerce.

Et c’est pourquoi les canoniques auto-référencés sont incroyablement utiles. Les gens peuvent souvent créer des liens vers des URL avec des requêtes et des paramètres UTM, ce qui signifie que lorsque cela se produit, Google peut commencer à récupérer l’URL avec des paramètres comme version canonique. Par conséquent, tirer parti des canoniques d’auto-référence permet d’éviter cette situation en spécifiant explicitement l’URL que vous considérez comme la version la plus importante ou principale de cette page.

URL canoniques inter-domaines

Dans le cas où vous avez le même contenu sur plusieurs domaines, vous pouvez également utiliser la canonisation. Un bon exemple de ceci est certains sites Web qui récupèrent et repartagent le contenu de sites Web qui ne sont pas les leurs – éventuellement en organisant des articles dans un créneau spécifique. Si une URL canonique est définie sur la source d’origine du contenu (où il a été publié pour la première fois), tous les liens pointant vers la deuxième version seront pris en compte dans la version canonique d’origine, ce qui augmente les chances de classement du contenu d’origine.

Canonisation pour les pages AMP

Documents AMP HTML requis pour définir des URL canoniques sur toutes les pages AMP qui référencent l’équivalent non-AMP (ou référencent automatiquement la page AMP s’il n’y a pas d’équivalent disponible). La balise canonique est un élément HTML obligatoire pour que le contenu AMP soit considéré comme valide et dans les cas où cela est possible, la balise canonique est censée pointer vers la version originale non AMP du contenu.

Remarque : Dans de tels scénarios, la version originale non AMP du contenu qui est utilisée comme URL canonique dans l’équivalent de la page AMP ne peut pas être elle-même non indexable (par n’importe quelle méthode, y compris une redirection 301, une autre URL canonique, etc. .)

En effet, cela enverrait des messages contradictoires aux moteurs de recherche, ce qui rend très probable que la page AMP n’apparaisse pas du tout dans les résultats de recherche.

TL;DR – La balise canonique est un élément obligatoire pour que les pages AMP soient considérées comme valides, et la balise canonique est censée pointer vers la version originale “non-AMP” de la page. Si la page est AMP autonome, alors le canonique doit être auto-référentiel.

Différentes versions de sites Web pour différents appareils

Canonisation des sites Web mobiles

Si vous avez un scénario avec un site Web qui a des pages de bureau et mobiles séparées, c’est-à-dire deux versions du site, comme une sur marketingskills.fr et une version mobile sur m.marketingskills.fr, vous devez utiliser des URL canoniques et rel=alternate pour indiquer la similitude/la relation entre ces deux pages.

Remarque : Google est le seul moteur de recherche à prendre officiellement en charge cette mise en œuvre pour le moment.

En pratique, voici à quoi cela ressemblerait sur la version Desktop et Mobile d’un site Web :

Ordinateur de bureau

Sur la version de bureau de la page, l’URL canonique et l’URL alternative dans la section se présentent comme suit :

<head>
	<link rel="canonical" href="https:// votresite.com/" />
	<link rel="alternate" href="https://m.votresite.com/" />
</head>

Mobile

Sur la version mobile de la page, l’URL canonique dans la section

doit apparaître comme suit :

<head>
	<link rel="canonical" href="https://votresite.com/" />
</head>

De cette façon, il est plus facile pour les moteurs de recherche de comprendre quelle version de la page afficher pour les appareils mobiles et quelle version afficher pour les chercheurs de bureau.

Mythes et idées fausses courants sur les URL canoniques

Bien qu’elle existe depuis un certain temps, la canonisation est difficile à comprendre et il est facile de se tromper.

Voici quelques exemples de problèmes courants que vous pouvez rencontrer lorsque vous utilisez la canonisation sur vos sites Web :

Utilisation incorrecte de la canonisation sur les sites Web multilingues

URL canoniques de sites Web multilingues

Les sites Web multilingues utilisent généralement des balises Hreflang pour stocker et afficher différentes versions d’une page Web en fonction de l’emplacement géographique d’un utilisateur.

Lorsque vous utilisez des balises hreflang, vous devez spécifier une page canonique dans la même langue, ou la meilleure langue de substitution possible si une canonique n’existe pas pour la même langue.

Cela étant dit, si vous choisissez de ne pas indiquer d’URL canonique, Google identifiera ce qu’il pense être la meilleure version ou URL.

Si vous utilisez WordPress comme système de gestion de contenu de choix (ce que nous recommandons évidemment vivement) et que vous proposez du contenu aux visiteurs du site Web dans plusieurs langues, nous vous recommandons fortement d’utiliser le plug-in de traduction Weglot pour votre site Web.

Nous avons vérifié de manière indépendante qu’ils gèrent la canonisation comme indiqué et officiellement recommandé par Google. Un autre plugin que nous pouvons recommander est TranslatePress.

Canonisation des séries de pages

John Mueller de Google a déclaré que la canonisation de toutes les pages paginées sur la première page de la série est considérée comme une utilisation inappropriée de la balise rel=canonical. La page 2 de la série ne peut pas être considérée comme équivalente à la page 1, il serait donc incorrect d’utiliser la canonisation dans cette situation.

Définir également l’URL canonique sur “Noindex”

L’utilisation de la canonisation et de la non-indexation n’aurait aucun sens. Le simple fait de ne pas indexer une page n’indique pas à Google quelle page vous souhaitez combiner avec une autre page et que les signaux de classement doivent être transmis à ladite page maître.

Lorsque Google voit deux URL de votre site, elles se ressemblent et que vous nous indiquez clairement votre préférence, nous essaierons de les combiner et de les traiter comme une seule URL (généralement plus forte) au lieu d’URL distinctes. Les redirections, rel=canonical, liens internes et externes, plans de site, hreflang, etc. nous indiquent tous vos préférences, et plus vous pouvez les aligner, plus nous les suivrons et les utiliserons pour choisir un canonique parmi cet ensemble ( et transmettre tous les signaux au canonique choisi).

D'un autre côté, noindex (seul) et robots.txt interdits (en général) ne sont pas des signes clairs de canonisation. Le simple fait d'avoir un noindex sur une page ne nous dit pas que vous voulez le combiner avec autre chose, et que les signaux doivent être transmis. Une interdiction de robots.txt est encore plus délicate, nous ne savons même pas si la page correspond à autre chose sur votre site, nous ne pourrions donc même pas l'utiliser pour la canonisation si nous le voulions.
John Mueller, analyste des tendances pour les webmasters John Mueller

En termes simples, vous pourriez dire que rel=canonical fait ce que font les redirections 301 ; attribue tous les liens vers la version non canonique à la version canonique mais sans la redirection (puisque vous voulez pouvoir conserver l’accès aux deux pages).

Les URL canoniques sont destinées aux situations dans lesquelles vous ne pourriez pas (et ne devriez pas) implémenter une redirection 301.

De même, ne faites pas des choses comme canoniser la page A -> page B puis rediriger la page B -> page A ou enchaîner les balises canoniques, comme pointer la page A -> B, la page B -> C, etc.). Il est important d’envoyer des signaux clairs, car autrement, vous conduisez souvent les moteurs de recherche à prendre de mauvaises décisions.

Si vous avez déjà envisagé à la fois de canoniser une URL et de ne pas l’indexer, vous devriez envisager d’utiliser une redirection 301. Et si vous ne pouvez pas utiliser de redirection, vous ne devez utiliser que rel=canonical.

Indiquer uniquement une version de site Web préférée dans la Google Search console

Une option pour définir des URL canoniques consiste à utiliser la Google Search Console pour spécifier votre domaine canonique préféré. Il y a plusieurs raisons pour lesquelles cette méthode est bénéfique, notamment parce qu’elle est rapide et extrêmement facile à mettre en œuvre.

Cependant, il existe également des problèmes connus associés à l’utilisation de cette méthode. Il serait, par exemple, utilisé pour spécifier un domaine préféré, mais vous auriez toujours besoin d’un plugin comme Rank Math pour spécifier facilement des URL canoniques pour des publications et des pages spécifiques sur une base individuelle lorsque vous rencontrez divers scénarios.

Et, bien sûr, un autre inconvénient de cette approche est que la spécification du domaine préféré dans Google Search Console ne définit correctement que la variation canonique pour Google, mais ne le fait pas pour les autres moteurs de recherche.

Les URL canoniques sont-elles considérées comme des directives pour les moteurs de recherche ?

Les URL canoniques ne sont pas considérées comme des directives, cependant, elles sont considérées comme un signal de moteur de recherche. Cela signifie qu’ils sont importants et qu’ils doivent être utilisés car ils aident les moteurs de recherche à comprendre un

le contenu du site Web et son lien avec d’autres contenus de votre site

Faut-il canoniser la première page d’une série de pages ?

Non, c’est une idée fausse très répandue. Chaque page d’une série de pages paginées doit avoir sa propre URL canonique d’auto-référence. Si vous l’avez fait sur votre site, ou si vous l’avez fait, il est probable que Google s’en rendra compte et ignorera le signal (puisqu’il ne s’agit pas d’une directive).

Pouvez-vous définir des URL canoniques en tant qu’URL relatives ?

Bien que la balise de lien accepte les URL relatives, elle est en fait considérée comme du HTML valide – l’utilisation d’URL relatives dans les canoniques peut entraîner d’autres problèmes, notamment la configuration incorrecte de l’URL de base, ce qui rendrait l’ensemble de la configuration canonique invalide.

En fait, Google lui-même a déclaré que certains des problèmes les plus courants rencontrés avec les canoniques proviennent en fait de l’utilisation d’URL relatives.

En bref, puisque le but d’une URL canonique est d’indiquer précisément quelle URL est la préférence (avec précision, sans ambiguïté), cela est vraiment mieux réalisé en utilisant des URL absolues lors de la définition d’URL canoniques sur votre site Web.

Les sites Web multilingues utilisent généralement des balises Hreflang pour stocker et afficher différentes versions d’une page Web en fonction de l’emplacement géographique d’un utilisateur.

Lorsque vous utilisez des balises hreflang, vous devez spécifier une page canonique dans la même langue, ou la meilleure langue de substitution possible si une canonique n’existe pas pour la même langue.

Cela étant dit, si vous choisissez de ne pas indiquer d’URL canonique, Google identifiera ce qu’il pense être la meilleure version ou URL.

Si vous utilisez WordPress comme système de gestion de contenu de choix (ce que nous recommandons évidemment vivement) et que vous proposez du contenu aux visiteurs du site Web dans plusieurs langues, nous vous recommandons fortement d’utiliser le plug-in de traduction Weglot pour votre site Web.

Nous avons vérifié de manière indépendante qu’ils gèrent la canonisation comme indiqué et suggéré par Google.

Conclusion : L’utilisation correcte des URL canoniques est importante

Et c’est tout! Nous espérons que nous avons été en mesure de répondre à toutes les questions que vous vous posez sur les URL canoniques et sur la manière de les utiliser dans les situations auxquelles vous êtes confronté et avec les sites Web que vous gérez.

Définir des URL canoniques personnalisées (et encore moins définir automatiquement des URL canoniques auto-référencées par défaut) peut-être très facile avec l’aide d’un plugin et de wordpress.

S’inscrire à la Newsletter


Chaque semaine nos conseils et astuces pratiques actionnables dans votre boîte mail.

En vous abonnant, vous acceptez notre politique de confidentialité.

Articles qui peuvent vous intéresser

A propos de l'auteur