Un guide simple pour les débutants


Vous souhaitez savoir ce que sont les balises canoniques et comment les utiliser pour éviter les problèmes de contenu redondés redoutés?

Les balises canoniques ne sont pas nouvelles. Ils ont été autour depuis 2009—La meilleure partie de la décennie.

Google, Microsoft et Yahoo se sont unis pour les créer. Leur but? Fournir aux propriétaires de sites Web un moyen de résoudre rapidement et facilement les problèmes de contenu en double.

Est-ce qu'ils travaillent? Oui, parfaitement… mais seulement si vous savez comment les utiliser!

Dans ce guide, vous apprendrez:

Qu'est-ce qu'une balise canonique?

Une balise canonique est un extrait de HTML code qui définit la version principale pour les pages en double, quasi-dupliquées et similaires. En d'autres termes, si vous avez le même contenu ou un contenu similaire disponible sous différentes URL, vous pouvez utiliser des balises canoniques pour spécifier quelle version est la version principale et doit donc être indexée.

balises canoniques image 01

A quoi ressemble une balise canonique?

Les balises canoniques utilisent une syntaxe simple et cohérente et sont placées dans le section d'une page Web:

Voici ce que chaque partie de ce code signifie en clair:

  1. lien rel = “canonique”: Le lien dans cette balise est la version principale (canonique) de cette page.
  2. href = “https://example.com/sample-page/”: La version canonique peut être trouvée à cette URL.

Pourquoi les balises canoniques sont-elles importantes pour SEO?

Google n'aime pas le contenu en double. Cela rend plus difficile pour eux de choisir:

  1. Quelle version d’une page à indexer (ils n’en indexeront qu’une!)
  2. Quelle version d'une page à classer pour les requêtes pertinentes.
  3. Devraient-ils consolider «l'équité du lien» sur une page ou la diviser en plusieurs versions?

Trop de contenu en double peut également affecter votre «budget d'analyse». Cela signifie que Google finira peut-être par perdre son temps à explorer plusieurs versions de la même page au lieu de découvrir d'autres contenus importants sur votre site Web.

balises canoniques image 02

La vérité sur le budget d'exploration

Forcer Google à perdre du temps à analyser le contenu en double est, bien sûr, une chose à éviter si possible. Cependant, Google déclare que ce n'est pas un problème pour la plupart des sites.

Si les nouvelles pages ont tendance à être explorées le jour même de leur publication, le budget d'exploration n'est pas un sujet sur lequel les webmasters doivent se concentrer. De même, si un site contient moins de quelques milliers d'URL, la plupart du temps, il sera analysé efficacement.

Les balises canoniques résolvent tous ces problèmes. Ils vous permettent d'indiquer à Google quelle version d'une page ils doivent indexer et classer, et où consolider tout "lien d'équité".

Impossible de spécifier un canonique URLet Google prendra les choses en main dans leurs propres mains.

Si vous n’indiquez pas un nom canonique URL, nous identifierons ce que nous pensons être la meilleure version ou URL.

Compter sur Google comme ça n’est pas une bonne idée. Ils peuvent sélectionner une version de votre page que vous ne voulez pas vraiment être canonique.

IMPORTANT REMARQUE

Google États qu'ils respectent habituellement le canonique URL vous définissez, mais pas toujours.

Notez que même si vous désignez explicitement une page canonique, Google peut en choisir un autre pour différentes raisons, telles que les performances ou le contenu.

L'utilisation des meilleures pratiques en matière de balises canoniques aidera à limiter le risque que Google considère qu'une version non souhaitée de la page est canonique.

Mais je n'ai pas de contenu en double, n'est-ce pas?

Étant donné que vous n’avez probablement pas publié les mêmes publications et pages à plusieurs reprises, il est facile de supposer que votre site Web ne contient aucun contenu en double.

Mais les moteurs de recherche analysent les URL, pas les pages Web.

Cela signifie qu'ils voient example.com/product et example.com/product?color=red en tant que pages uniques, bien qu’elles soient la même page Web avec un contenu identique ou similaire.

Celles-ci sont appelées URL paramétrées et constituent une cause fréquente de duplication de contenu, en particulier sur commerce électronique sites avec navigation facettée / filtrée.

Par exemple, Vêtements Brown Bag vend des chemises. C'est le URL pour leur page de catégorie principale:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html

Si vous filtrez pour seulement XL chemises, un paramètre est ajouté à la URL:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html? Taille =XL

Si vous filtrez ensuite uniquement les chemises bleues, un autre paramètre est ajouté:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html? Taille =XLEtcouleur = bleu

Ce sont toutes des pages distinctes aux yeux de Google, même si le contenu n’est que légèrement différent.

Mais ce ne sont pas seulement les sites de commerce électronique qui sont victimes de dupliquer le contenu.

Voici d'autres causes courantes de contenu en double qui s'appliquent à tous les types de sites Web:

  • Avoir des URL paramétrées pour les paramètres de recherche (par exemple., example.com?q=search-term)
  • Avoir des URL paramétrées pour les identifiants de session (par exemple, https://example.com?sessionid=3)
  • Avoir des versions imprimables séparées des pages (par exemple., exemple.com/page et example.com/print/page)
  • Avoir des URL uniques pour les publications de différentes catégories (par exemple., exemple.com/prestations de service/SEO/ et exemple.com/promotions/SEO/)
  • Avoir des pages pour différents types d'appareils (par exemple., exemple.com et m.exemple.com)
  • Ayant AMP et versions non-AMP d'une page (par exemple., exemple.com/page et amp.example / page)
  • Servir le même contenu dans des variantes non-www / www et non-https / https (par exemple., https://example.com et http://www.example.com)

Dans ces situations, l'utilisation correcte des balises canoniques est cruciale.

En outre, les problèmes de contenu en double entre domaines sont également un problème. chose. Si vous syndiquez du contenu (par exemple, si un journal souhaite republier votre contenu textuellement sur son site), vous devez leur demander de placer un lien canonique vers l'original.

Cela permet d’obtenir du trafic de référence de cette publication tout en atténuant le risque de classement incorrect par Google. URL.

Sidenote.

Certains sites peuvent refuser d'ajouter un lien canonique. Dans ce cas, c’est à vous de décider si vous voulez prendre le risque. Si vous le faites, gardez un œil sur la page syndiquée pour vous assurer qu’elle ne dépasse pas l’original.

Les bases de l'implémentation canonique des tags

Les canoniques sont faciles à mettre en œuvre. Nous discuterons de quatre manières différentes de le faire dans un instant. Mais quelle que soit la méthode que vous choisissez, il y a cinq règles d'or que vous devez vous rappeler à tout moment.

Règle n ° 1: Utiliser des URL absolues

John Mueller, de Google, a déclaré que la meilleure pratique consiste à ne pas utiliser de chemins relatifs avec l'élément de lien rel = "canonique".

Donc, vous devriez utiliser la structure suivante:

<link rel = “canonique” href = “https://example.com/sample-page/”/>

Contrairement à celui-ci:

<link rel = “canonique” href = ”/Page d'exemple/”/>

Règle n ° 2: Utiliser des URL minuscules

Étant donné que Google peut traiter les URL majuscules et minuscules comme deux URL différentes, vous devez d'abord vous assurer que forcer les URL minuscules sur votre serveur puis utilisez des URL minuscules pour vos balises canoniques.

Règle n ° 3: Utilisez la version de domaine correcte (HTTPS contre. HTTP)

Si vous êtes passé à SSL, assurez-vous de ne pas déclarer de non-SSL (c.-à-d., HTTP) URL dans vos balises canoniques. Cela peut théoriquement conduire à une confusion et à des résultats inattendus. Si vous êtes sur un domaine sécurisé, veillez à utiliser la version suivante de votre URL:

<link rel = “canonique” href = “https: //example.com/sample-page/ ”/>

Par opposition à:

<link rel = “canonique” href = “http: //example.com/sample-page/ ”/>

Sidenote.

Si vous n’utilisez pas HTTPS alors le contraire est vrai.

Règle n ° 4: Utiliser des balises canoniques auto-référentielles

John Mueller de Google indique que, bien que non obligatoires, les balises canoniques auto-référentielles sont conseillé.

je recommande [using a] canonique auto-référentiel car il nous indique vraiment quelle page vous souhaitez indexer, ou ce que le URL devrait être quand il est indexé.

Même si vous avez une page, il existe parfois différentes variations de la URL qui peut tirer cette page vers le haut. Par exemple, avec des paramètres à la fin, peut-être avec des majuscules ou www et non-www. Toutes ces choses peuvent être en quelque sorte nettoyées avec une balise rel canonique.

John Mueller

Si vous ne savez pas comment fonctionne un canonique auto-référentiel, il s’agit essentiellement d’une balise canonique sur une page qui pointe vers elle-même. Par exemple, si le URL étaient https://example.com/sample-page, alors un canonique auto-référençant sur cette page serait:

Plus populaire populaire CMS’Ajoutez automatiquement des URL d’auto-référencement, mais votre développeur devra le coder en dur si vous utilisez un script personnalisé. CMS.

Règle n ° 5: Utilisez une balise canonique par page

Si la page a plusieurs balises canoniques, alors Google va ignorer les deux.

En cas de déclarations multiples de rel = canonical, Google ignorera probablement tous les conseils rel = canonical.

Comment implémenter des canoniques

Il existe quatre façons de spécifier des URL canoniques:

  1. HTML tag (rel = canonique)
  2. HTTP entête
  3. Plan du site
  4. 301 redirection *

Pour les avantages et les inconvénients de chaque méthode, voir Documentation officielle de Google.

1. Paramétrer les canoniques avec rel = “canonique” HTML Mots clés

L’utilisation d’une balise rel = canonique est le moyen le plus simple et le plus évident de spécifier un canonique. URL.

Ajoutez simplement le code suivant à la section de toute page en double:

Exemple

Disons que vous avez un site de commerce électronique vendant des t-shirts. Tu veux https://yourstore.com/tshirts/black-tshirts/ être le canonique URL, même si le contenu de cette page est accessible via d’autres URL (par exemple, https://yourstore.com/offers/black-tshirts/)

Ajoutez simplement la balise canonique suivante à toutes les pages en double:

Notez que si vous utilisez un CMS, vous n’avez pas besoin de jouer avec le code de votre page. Il y a un moyen plus facile.

Définir des balises canoniques dans WordPress:

Installer Yoast SEO et les balises canoniques auto-référencées seront ajoutées automatiquement. Pour définir des canoniques personnalisés, utilisez la section «Avancé» de chaque publication ou page.

yoast canonique

Définition des balises canoniques dans Shopify:

Shopify ajoute des URL canoniques à référencement automatique pour les produits et les articles de blog par défaut. Pour définir des URL canoniques personnalisées, vous devez modifier directement les fichiers de modèle (.liquid).

Ce fil a quelques informations sur la façon de le faire.

Définition des balises canoniques dans Squarespace:

Squarespace ajoute également des URL à référence automatique par défaut. Mais, comme c'est le cas avec Shopify, vous devez modifier le code directement si vous souhaitez ajouter un code canonique personnalisé. URL.

2. Définir les canoniques dans HTTP en-têtes

Pour les documents tels que les PDF, il n’ya aucun moyen de placer des balises canoniques dans l’en-tête de page, car il n’existe pas de page. section. Dans ce cas, vous devrez utiliser HTTP en-têtes pour définir des canoniques.

Exemple

Imaginez que nous créons un PDF version de ce blog et hébergez-le dans notre sous-dossier de blog (ahrefs.com/blog/*).

Voici ce que notre HTTP l'en-tête pourrait ressembler à ce fichier:

HTTP / 1.1 200 OK
Type de contenu: application / pdf
Lien: ; rel = "canonique"

Lecture recommandée: Comment ajouter la balise canonique à HTTP En-têtes

3. Définir les canoniques dans les sitemaps

Google États que les pages non-canoniques ne devrait pas être inclus dans les sitemaps. Seules les URL canoniques doivent être répertoriées. C’est parce que Google voit les pages répertoriées dans un plan du site comme des suggestions canoniques.

Cependant, ils ne sélectionnent pas toujours les URL dans les sitemaps comme des canoniques.

Nous ne pouvons pas garantir que nous considérerons les URL de sitemap comme canoniques, mais c’est un moyen simple de définir des canoniques pour un site volumineux. Les sitemaps sont un moyen utile d'indiquer à Google les pages que vous jugez les plus importantes sur votre site.

4. Paramétrer les canoniques avec les redirections 301

Utilisez les redirections 301 lorsque vous souhaitez détourner le trafic d'un doublon URL et à la version canonique.

Exemple

Supposons que votre page est accessible à ces URL:

  • exemple.com
  • exemple.com/index.php
  • example.com/home/

Choisissez-en un URL comme le canonique et rediriger les autres URL là-bas.

Vous devriez faire la même chose pour sécurisé HTTPS/HTTP et les versions www / non ‐ www de votre site. Choisissez une version canonique et redirigez les autres vers cette version.

Par exemple, la version canonique de ahrefs.com est le HTTPS non-www URL (https://ahrefs.com). Toutes les URL suivantes y redirigent:

  • http://ahrefs.com/
  • http://www.ahrefs.com/
  • https://www.ahrefs.com/

Lis notre guide complet sur l'implémentation des redirections 301.

Erreurs de canonisation communes à éviter

La canonisation est un sujet assez complexe. En tant que tel, il y a beaucoup de malentendus et d'idées fausses sur la manière de canoniser correctement.

Voici quelques erreurs courantes commises lorsque vous essayez de canoniser:

Erreur n ° 1: blocage du canonisé URL via robots.txt

Bloquer un URL dans robots.txt empêche Google de l'explorer, ce qui signifie qu'ils ne peuvent voir aucune balise canonique sur cette page. Cela les empêche à leur tour de transférer toute «équité de lien» du non ‐ canonique au canonique.

Erreur n ° 2: Définir le canonique URL vers «noindex»

Ne mélangez jamais noindex et rel = canonical. Ce sont des instructions contradictoires.

Google donne généralement la priorité à la balise canonique par rapport à la balise "noindex", comme le dit John Mueller. ici. Mais c’est toujours une mauvaise pratique. Si vous voulez noindex et canoniser un URL, utilisez une redirection 301. Sinon, utilisez rel = canonique.

Erreur n ° 3: Définition d'un 4XX HTTP code de statut pour le canonicalized URL

Définir un 4XX HTTP code de statut pour un canonicalized URL a le même effet que l’utilisation de la balise ‘noindex’: Google ne pourra pas voir la balise canonique ni transférer «l'équité du lien» vers la version canonique.

Erreur n ° 4: canoniser toutes les pages paginées vers la page racine

Les pages paginées ne doivent pas être canonisées à la première page paginée de la série. Au lieu de cela, les canoniques auto-référencés devraient être utilisés sur toutes les pages paginées.

Pourquoi? Comme John Mueller de Google a déclaré sur Reddit, c’est une mauvaise utilisation du rel = canonique.

La principale chose à éviter, puisque cet article concerne la canonisation, consiste à utiliser le rel = canonical à la page 2 pointant vers la page 1. La page 2 n’équivalent pas à la page 1, de sorte que rel = canonical serait incorrect.

John Mueller

Vous devez également utiliser les balises rel = prev / next pour la pagination. Ceux-ci sont n'est plus utilisé par Google, mais Bing les utilise toujours.

Erreur n ° 5: ne pas utiliser les balises canoniques avec hreflang

Balises Hreflang sont utilisés pour spécifier la langue et le ciblage géographique d'une page Web.

Google États que, lorsque vous utilisez hreflang, vous devez “spécifier une page canonique dans la même langue ou la meilleure langue de substitution possible s’il n’existe pas de canonique pour la même langue”.

Comment trouver et résoudre les problèmes de canonisation sur votre site

Il est facile de faire des erreurs avec la canonisation, il est donc utile de vérifier régulièrement votre site Web pour détecter les problèmes liés aux balises canoniques et de les résoudre. au plus vite.

Pour cela, vous pouvez utiliser Audit du site d’Ahrefs.

https://www.youtube.com/watch?v=LjinWqfGyVE

Site Audit analyse votre site Web pendant plus de 100 SEO questions, y compris celles liées aux balises canoniques.

Voici les douze problèmes liés aux balises canoniques que Site Audit peut identifier, et comment les résoudre:

1. Points canoniques à 4XX

Cet avertissement se déclenche quand une ou plusieurs pages sont canonisées en un 4XX URL.

Pourquoi c’est un problème

Les moteurs de recherche n'indexent pas 4XX pages car ils ne fonctionnent pas. En conséquence, ils ignorent les balises canoniques pointant vers de telles pages et finissent souvent par indexer la version erronée (non canonique) de la page.

Comment réparer

Examinez les pages concernées et remplacez les morts (4XX) des liens canoniques avec des liens vers des (200) pages de travail que vous souhaitez indexer.

2. Points canoniques à 5XX

Cet avertissement se déclenche lorsqu'une ou plusieurs pages sont canonisées en un 5XX URL.

Pourquoi c’est un problème

5XX HTTP Les codes de statut indiquent des problèmes de serveur qui entraînent une page canonique inaccessible. Il est peu probable que Google indexe les pages inaccessibles, donc peut ignorer le canonique.

Comment réparer

Remplacez les URL canoniques erronées par des URL valides. Recherchez les erreurs de configuration du serveur si le canonique spécifié semble correct. Notez qu'il peut s'agir d'un problème temporaire si l'analyse a eu lieu alors que votre site était arrêté pour maintenance ou que le serveur de votre site était surchargé.

3. Points canoniques à rediriger

Cet avertissement se déclenche quand une ou plusieurs pages sont canonisées en une redirection. URL.

Pourquoi c’est un problème

Les textes canoniques doivent toujours pointer vers la version la plus autorisée d'une page. Ce n'est pas le cas avec la redirection d'URL. En conséquence, les moteurs de recherche peuvent mal interpréter ou ignorer le canonique.

Comment réparer

Remplacez les liens canoniques par des liens directs vers la version la plus autorisée de la page (c'est-à-dire, une qui renvoie 200 HTTP code de statut et ne redirige pas).

4. Pages en double sans canonique

Cet avertissement se déclenche lorsqu'il existe une ou plusieurs pages en double ou très similaires qui ne spécifient pas de version canonique.

Pourquoi c’est un problème

Comme aucun élément canonique n’est spécifié, Google essaiera d’identifier la version la plus appropriée à afficher dans les résultats de recherche. Ce n'est peut-être pas la version que vous souhaitez indexer.

Comment réparer

Passez en revue les groupes de doublons. Choisissez une version canonique qui devrait être indexée dans les résultats de la recherche. Spécifiez ceci comme version canonique pour tous les doublons (et ajoutez une balise canonique à auto-référencement à la version canonique).

5. Hreflang à non ‐ canonique

Cet avertissement se déclenche quand une ou plusieurs pages spécifient une valeur non ‐ canonique. URL dans leurs annotations hreflang.

Pourquoi c’est un problème

Les liens dans les balises hreflang devraient toujours pointez sur les pages canoniques. Les liens vers une version non canonique d'une page à partir d'annotations hreflang peuvent confondre et induire en erreur les moteurs de recherche.

Comment réparer

Remplacez les liens dans les annotations hreflang des pages affectées par leurs noms canoniques.

6. canonique URL n'a pas de liens internes entrants

Cet avertissement se déclenche lorsqu'une ou plusieurs URL canoniques spécifiées ne comportent aucun lien entrant interne.

Pourquoi c’est un problème

Les URL canoniques sans liens internes sont inaccessibles aux visiteurs du site Web. Quelque part sur le site, ils sont dirigés vers une version non canonique de la page.

Comment réparer

Remplacez les liens internes vers les pages canonisées par des liens directs vers le canonique.

7. Page non ‐ canonique dans le plan du site

Cet avertissement se déclenche lorsqu'une ou plusieurs pages non canoniques sont répertoriées dans le sitemap.

Pourquoi c’est un problème

Google indique que vous ne devez pas inclure d'URL non canoniques dans votre sitemap. Raison d'être, ils voient les pages dans les sitemaps comme canoniques suggérées. Vous devez uniquement répertorier les pages que vous souhaitez indexer dans des sitemaps.

Comment réparer

Supprimez les URL non canoniques de votre sitemap.

8. Page non canonique spécifiée comme canonique

Cet avertissement se déclenche quand une ou plusieurs pages spécifient une valeur canonique. URL qui est également canonisé sur une page différente. Cela crée une «chaîne canonique» où la page A est canonisée en page B, puis canonisée en page C.

balises canoniques image 03

Pourquoi c’est un problème

Les chaînes canoniques peuvent confondre et induire en erreur les moteurs de recherche. En conséquence, ils peuvent mal interpréter ou ignorer le canonique spécifié.

Comment réparer

Remplacez les liens non-canoniques dans les balises canoniques des pages affectées par des liens directs vers les canoniques. Par exemple, si la page A est canonisée en page B, qui est ensuite canonisée en page C, remplacez alors le lien canonique de la page A par un lien vers la page C.

9. Ouvrir le graphique URL ne correspondant pas canonique

Cet avertissement se déclenche en cas de non concordance entre les règles canoniques spécifiées et Open Graph. URL sur une ou plusieurs pages.

Pourquoi c’est un problème

Si le graphique ouvert URL ne correspond pas à la règle canonique, puis une version non-canonique d’une page sera partagée sur les réseaux sociaux.

Comment réparer

Remplacer le graphique ouvert URL sur les pages affectées avec le canonique URL. Assurez-vous que les deux URL sont les mêmes.

Sidenote.

Les URL à l'intérieur des balises Open Graph doivent être absolues et utiliser les protocoles http: // ou https: //, comme dans le cas des canoniques.

10. Canonical à partir de HTTPS à HTTP

Cet avertissement se déclenche lorsqu'un ou plusieurs objets sécurisés (HTTPS) pages spécifient un non ‐ sécurité (HTTP) en version canonique.

Pourquoi c’est un problème

HTTPS est un facteur de classementIl est donc logique de spécifier des versions sécurisées des pages aussi canoniques que possible.

Comment réparer

Rediriger le HTTP page au HTTPS équivalent. Si cela n’est pas possible, ajoutez un lien rel = “canonique” à partir du HTTP version de la page au HTTPS un.

Sidenote.

Google répertorie également la mise en œuvre HSTS comme solution potentielle.

11. Canonical à partir de HTTP à HTTPS

Cet avertissement se déclenche lorsqu'un ou plusieurs problèmes non sécurisés (HTTP) les pages spécifient un protocole sécurisé (HTTPS) en version canonique.

Pourquoi c’est un problème

HTTPS est préférable à HTTP. Avoir un HTTP version d'une page en spécifiant ensuite la HTTPS la version canonique est illogique.

Sidenote.

Cela ne causera probablement pas d’énormes problèmes, mais il reste à résoudre si possible.

Comment réparer

Implémenter une redirection 301 à partir de HTTP à HTTPS. Vous devez également remplacer tout lien interne vers le HTTP version de la page avec des liens directs vers le HTTPS version.

12. Les pages non-canoniques reçoivent du trafic organique

Cet avertissement se déclenche lorsqu'une ou plusieurs pages non canoniques apparaissent dans les résultats de recherche et génèrent un trafic de recherche organique (ce qui ne devrait pas se produire).

Pourquoi c’est un problème

Vos balises canoniques ne sont pas correctement configurées ou Google a choisi d’ignorer le canonique spécifié.

Comment réparer

Vérifiez que les balises rel = canoniques sont correctement configurées sur toutes les pages signalées. Si ce n’est pas le problème, utilisez le URL Outil d’inspection dans la console de recherche Google pour voir s’ils considèrent le canonique spécifié URL comme canonique. En cas de disparité, cherchez pourquoi cela pourrait être le cas.

Dernières pensées

Les balises canoniques ne sont pas cette compliqué. Ils sont difficiles à comprendre.

Rappelez-vous simplement que les balises canoniques ne sont pas une directive mais un signal pour les moteurs de recherche. En d'autres termes, ils peuvent choisir un autre canonique que celui que vous déclarez.

Vous pouvez utiliser le URL Outil d'inspection dans la console de recherche Google pour voir les droits canoniques déclarés par l'utilisateur et sélectionnés par Google.

outil d'inspection url

Des questions? Faites-moi savoir dans les commentaires ou sur Twitter.





Source link

Posted on 19 juillet 2019 in Blog

Share the Story

Back to Top