Cinq erreurs courantes avec l'attribut rel=canonical

Lundi 8 avril 2013

L'ajout d'un lien rel=canonical dans une page Web permet d'indiquer que cette version doit être indexée de préférence par les moteurs de recherche, et ce, par rapport aux pages identiques présentes sur le Web. Cette balise est compatible avec plusieurs moteurs de recherche, y compris Yahoo!, Bing et Google. Non seulement le lien rel=canonical consolide les propriétés d'indexation du contenu en double, tel que les liens entrants, mais il indique également l'URL que vous souhaitez voir s'afficher dans les résultats de recherche. Cependant, rel=canonical peut s'avérer un peu délicat, car il n'est alors pas facile de savoir s'il y a une erreur de configuration.

Exemple de page et de balisage HTML pour rel-canonical.

Alors que le webmaster voit la page "red velvet" sur son navigateur à gauche, c'est la mention "blue velvet" du lien rel=canonical à droite, introduite par erreur par ce même webmaster, qui est prise en compte par les moteurs de recherche. Nous vous recommandons de suivre les bonnes pratiques suivantes pour utiliser rel=canonical :

  • Une grande partie du contenu de la page en double doit être présente dans la version canonique.
  • Vérifiez que votre cible rel=canonical existe (vérifiez qu'il ne s'agit pas d'une erreur ni de "soft 404").
  • Vérifiez que la cible rel=canonical ne contient pas de balise meta noindex pour les robots.
  • Assurez-vous que l'URL comportant rel=canonical est la version que vous voulez voir s'afficher dans les résultats de recherche (plutôt que l'URL en double).
  • Incluez le lien rel=canonical dans la section <head> de la page ou dans l'en-tête HTTP.
  • Ne spécifiez pas plus d'un rel=canonical pour une page. Si vous en indiquez plusieurs, tous les liens rel=canonical sont ignorés.

Première erreur : ajouter un lien rel=canonical redirigeant vers la première page d'une série paginée

Supposez que vous ayez un article qui soit présenté sur plusieurs pages :

  • example.com/article?story=cupcake-news&page=1
  • example.com/article?story=cupcake-news&page=2
  • et ainsi de suite.

L'ajout à la deuxième page (ou à toute page suivante) d'une balise rel=canonical redirigeant vers la première page n'est pas une utilisation correcte de rel=canonical, car il ne s'agit pas de pages en double. Si rel=canonical était utilisé dans ce cas, le contenu de la deuxième page et des pages suivantes ne serait pas indexé du tout.

Exemple de mauvais balisage rel-canonical.
On assiste à une perte du contenu de qualité, par exemple, "cookies are superior nutrition" ("les biscuits ont une plus grande valeur nutritionnelle") et "to vegetables" ("que les légumes") lorsque la balise rel=canonical redirigeant vers la première page est indiquée sur les pages composant une série.
Exemple d&#39;annotation d&#39;une série de pages avec rel-canonical qui renvoie vers une seule page avec tout le contenu de la série.
Lien rel=canonical des pages de la série redirigeant vers une page contenant tout l'article.
Exemple d&#39;annotation de pages avec rel-canonical et les annotations rel-prev-next obsolètes.
En l'absence d'un lien rel=canonical redirigeant vers une page intégrale, il est possible d'utiliser les balises rel="prev" et rel="next" dans le contenu paginé.

Deuxième erreur : URL absolues rédigées par erreur comme des URL relatives

Exemple de balisage rel-canonical incorrect : URL relatives incorrectes

La balise <link>, comme de nombreuses balises HTML, accepte les URL relatives et absolues. Les URL relatives incluent un chemin "relatif" à la page actuelle. Par exemple, images/cupcake.png signifie "à partir du répertoire actuel, accéder au sous-répertoire images, puis à cupcake.png". Les URL absolues spécifient le chemin d'accès complet, y compris le protocole. Exemple : https://.

Si vous spécifiez <link rel=canonical href="example.com/cupcake.html" /> (URL relative puisqu'il n'existe pas de https://), l'URL canonique souhaitée est https://example.com/example.com/cupcake.html, même si ce n'est très certainement pas ce qui était prévu. Dans ce cas, nos algorithmes peuvent ignorer le lien rel=canonical spécifié. En fin de compte, cela signifie que rien de ce que vous espériez réaliser grâce au lien rel=canonical ne va pas aboutir.

Troisième erreur : déclarations involontaires ou multiples de liens rel=canonical

Il peut arriver que nous observions des dénominations rel=canonical qui, de notre point de vue, ne sont pas voulues. Dans de très rares cas, il s'agit de simples coquilles, mais le plus souvent, le propriétaire du site, très occupé, a copié un modèle de page sans penser à modifier la cible du lien rel=canonical. Désormais, les pages du propriétaire du site spécifient un lien rel=canonical vers le site de l'auteur du modèle.

Exemple de balisage rel-canonical incorrect : URL incorrecte

Si vous utilisez un modèle, assurez-vous que vous n'avez pas copié ses indications rel=canonical par la même occasion.

Les pages incluant plusieurs liens rel=canonical redirigeant vers différentes URL constituent un autre problème. Cela est très fréquent dans le cas de l'utilisation conjointe de plug-ins de SEO qui insèrent souvent un lien rel=canonical par défaut, peut-être à l'insu du webmaster qui les a installés. En cas de déclarations rel=canonical multiples, il est possible que tous les liens rel=canonical correspondants soient ignorés par Google. Tout avantage qu'un lien rel=canonical légitime aurait pu apporter est ainsi perdu.

Dans ces deux types de cas, vérifier le code source de la page aidera à résoudre le problème. N'oubliez pas de vérifier l'intégralité de la section <head>, dans la mesure où les liens rel=canonical peuvent être dispersés.

Exemple de balisage rel-canonical incorrect : annotations rel-canonical multiples.

Vérifiez le comportement des plug-ins en examinant le code source de la page.

Quatrième erreur : la page de catégorie ou de destination indique un lien rel=canonical redirigeant vers un article phare du site

Supposons que vous gériez un site consacré aux desserts. Il dispose de pages de catégorie très utiles, concernant par exemple les pâtisseries ou les glaces. Chaque jour, un article est proposé dans les pages de catégorie. Par exemple, un article sur les cupcakes red velvet peut être présenté sur la page de destination relative aux pâtisseries. Dans la mesure où la page de catégorie "Pâtisseries" propose pratiquement le même contenu que la page concernant les cupcakes red velvet, vous ajoutez à la page de catégorie un lien rel=canonical redirigeant vers l'article individuel que vous souhaitez mettre en avant.

Si nous acceptions ce lien rel=canonical, la page de catégorie relative aux pâtisseries ne s'afficherait pas dans les résultats de recherche. Cela est dû au fait qu'en utilisant ce lien rel=canonical, vous indiquez que vous préférez que l'URL canonique soit affichée dans les moteurs de recherche, plutôt que l'URL dupliquée. Pour que les internautes soient en mesure de rechercher la page de catégorie ainsi que l'article individuel, il est préférable d'ajouter à la page de catégorie un lien rel=canonical redirigeant vers cette même page, ou de n'en ajouter aucun.

Exemple de balisage rel-canonical incorrect : URL ne faisant pas autorité pour la page

Rappelez-vous que la dénomination canonique détermine également l'URL à afficher de préférence. Évitez d'ajouter à une page de catégorie ou de destination un lien rel=canonical redirigeant vers un article phare de votre site.

Cinquième erreur : lien rel=canonical dans la section <body>

La balise de lien rel=canonical ne doit être ajoutée que dans la section <head> d'un document HTML. De plus, pour éviter les problèmes d'analyse HTML, il est recommandé d'inclure la balise rel=canonical le plus tôt possible dans la section <head>. Lorsque nous rencontrons une dénomination rel=canonical dans la section <body>, nous l'ignorons.

Il est très simple de corriger cette erreur. Il suffit de vous assurer que les liens rel=canonical sont toujours placés dans la section <head> de votre page, et au tout début de celle-ci, si possible.

Exemple de balisage rel-canonical incorrect : annotation rel-canonical dans la section HTML &quot;body&quot;.

Les dénominations rel=canonical dans la section <head> sont traitées, mais pas celles dans la section <body>.

Conclusion

Pour créer des dénominations rel=canonical utiles :

  • Vérifiez que la plus grande partie du texte principal d'une page en double est également présente sur la page canonique.
  • Vérifiez que rel=canonical n'est spécifié qu'une seule fois (le cas échéant) et dans la section <head> de la page.
  • Vérifiez que rel=canonical renvoie vers une URL existante dont le contenu est de qualité (c'est-à-dire qu'il ne s'agit pas d'une erreur 404 ou pire, d'une erreur soft 404).
  • Évitez d'indiquer dans des pages de catégorie ou de destination un lien rel=canonical redirigeant vers des articles de votre site, dans la mesure où l'article en question devient l'URL préférée qui s'affiche dans les résultats de recherche.

Comme toujours, n'hésitez pas à poser vos questions sur le forum d'aide pour les webmasters.