Qu’est-ce qui déclenche cette question ?
Ce numéro signale les pages qui ont un contenu en double mais qui ne déclarent pas leur version canonique (n’ont pas de balise canonique).
Pourquoi est-ce important ?
Bien que Google affirme qu’il peut choisir automatiquement la meilleure version du contenu à afficher dans ses résultats de recherche, ce ne sera pas nécessairement la version de la page que vous souhaitez indexer. C’est pourquoi les pages similaires ou dupliquées de votre site web doivent avoir un attribut « rel=canonical » pour indiquer aux moteurs de recherche d’afficher la version la plus autorisée (canonique) de la page dans les résultats de recherche.
Si vous n’utilisez pas cet attribut pour traiter les contenus dupliqués, les mauvaises versions des pages peuvent être indexées.
Le choix d’une URL canonique permet également de consolider les signaux de liens pour des pages similaires ou dupliquées en une seule URL préférée. C’est également une bonne façon de gérer les contenus syndiqués, car l’URL canonique peut pointer vers un domaine différent.
Enfin, les URL canoniques peuvent optimiser votre budget de crawling car Googlebot ne passera pas de temps à crawler des pages en double.
Note :
Même si vous avez indiqué à Google la version de page (canonique) préférée en utilisant « rel=canonique », Google peut toujours choisir une page différente. Google utilise un certain nombre d’autres signaux, tels que les protocoles http/https, la qualité de la page, les sitemaps, etc.
Comment y remédier ?
Passez en revue toutes les pages dont le contenu fait double emploi énumérées dans ce rapport.
Exemple :
Le nombre dans la colonne « Nombre de pages ayant le même contenu » est cliquable. Si vous cliquez dessus, vous obtiendrez une liste de pages dont le contenu est identique ou très similaire à l’URL en question.
Dans ce groupe de pages, vous devez choisir une version canonique que vous souhaitez voir indexée dans les résultats de recherche. Ajoutez son URL à l’étiquette « rel=canonical » sur chaque page dont le contenu est dupliqué, y compris la page canonique elle-même.
Vous pouvez exporter les résultats dans un fichier .csv à partir de Site Audit si nécessaire.
La page canonique peut être spécifiée par :
- L’utilisation de la rel=canonique tag dans le code d’une page.
Exemple :
...
http://ahrefs.com/blog/canonical-tags/" />
...
2. Utilisation de la méthode rel= »canonical ». En-tête HTTP dans votre page de réponse. Cette méthode est particulièrement applicable aux documents non-HTML tels que les fichiers PDF accessibles via plusieurs URL.
Exemple :
HTTP/1.1 200 OK
...
Link: <http://ahrefs.com/blog/canonical-tags/>; rel="canonical"
Seules les pages en direct valides doivent être spécifiées comme canoniques. L’URL canonique doit être une URL absolue spécifiant le protocole.
Par exemple, utilisez https://example.com/canonical-page/
Non /canonical-page/
Voir Les directives de Google sur la consolidation des URL en double.
Vous pouvez également définir 301 redirections pour les pages inutiles en double ou simplement les supprimer.