Les pages dupliquées sont des pages ayant le même titre/un contenu similaire. Mais pour que nous puissions voir la relation entre les deux pages, il existe des balises qui rendent cela possible ; elles le sont :
Hreflang – Cela signifie que les pages sont une traduction les unes des autres.
Pagination – Cela signifie qu’une page se poursuit à partir d’une autre.
Canonical – Cela signifie que les deux pages sont identiques, mais que l’une d’entre elles est la version officielle.
Si deux pages n’ont aucune de ces balises pour montrer la relation entre elles, elles sont considérées comme de mauvais doublons. Afin d’en faire de bons doublons, on utilise généralement un canonical pour montrer la relation entre eux.
Ahrefs est assez avancé lorsqu’il s’agit de regrouper les bons doublons –
- Deux pages font partie du même groupe si elles ont le même canonique (aucun canonique n’est considéré comme auto-canonique).
- Deux pages font partie du même groupe si elles ont le même hreflang.
- Deux pages font partie du même groupe si elles ont la même pagination.
Ainsi, par exemple, si la page « A » a la même règle que la page « B » et la page « C » une règle différente (mais la même que la page « A »), alors les pages « A », « B » et « C » font partie du même groupe.
À l’issue de votre audit de site, vous remarquerez dans la vue d’ensemble un graphique à barres horizontales représentant les « balises HTML et le contenu » (comme illustré dans l’image ci-dessous).
Vous vous demandez peut-être ce que sont les « bons » et les « mauvais » doublons, et vous vous demandez « tous les doublons ne sont-ils pas mauvais ?
Voyons voir…
Bons doubles – Ce sont des pages qui ont le même contenu, mais qui sont rendues claires par l’utilisation de balises canoniques, de pagination ou hreflang.
Mauvaises copies – Il s’agit de pages dupliquées qui n’ont pas de balises canoniques ou hreflang ou de pagination pour montrer qu’elles ont le même contenu ; OU elles ont ces balises (canoniques ou hreflang ou pagination) mais à des versions canoniques différentes – ce qui en fait encore des duplicatas.