Duplicate content
Indiquer à Google la page à prendre en compte prioritairement parmi toutes les pages de contenu similaire est possible grâce à l'attribut rel="canonical".
Qu'entend-on par Duplicate content ou duplication de contenu ? C'est la diffusion de contenus très proches sur le Web, par exemple, des pages de produits répertoriant la même gamme de produits, une fois par ordre alphabétique, l'autre fois par prix ou alors des communiqués de presse publiés sur différents sites. Le contenu dupliqué est un frein au référencement.
Google évite le contenu dupliqué pour deux raisons :
- fournir les résultats les plus pertinents à ses utilisateurs en évitant la duplication des résultats ;
- éviter d’alourdir ses bases de données.
Quand il rencontre deux pages similaires, Google retient celle qui lui paraît la plus adaptée à la requête de l'internaute. L’autre page qu’il identifie comme contenu dupliqué atterrit dans un index secondaire.
Le problème se pose par exemple si vous publiez un communiqué de presse et que ce dernier est publié par un site tiers ayant optimisé ce contenu de manière plus efficace que le vôtre. Vous risquez de vous retrouver dans un index secondaire et le site qui diffuse votre communiqué dans les premiers résultats des moteurs.
Google propose l’attribut rel="canonical" permettant au webmestre de définir lui-même la version préférée parmi les différentes pages et indiquer à Google la version à prendre en priorité dans les résultats de recherche.
On parle de page canonique. Il suffit pour le webmestre d’intégrer cet attribut rel="canonical".
L’insertion de cet attribut dans les pages de son site n’est pas en soi difficile, mais lorsqu’il s’agit de celui de tiers, la tâche peut s’avérer plus ardue.
C’est le cas notamment de sites diffusant un communiqué, une dépêche, les contenus repris par des sites partenaires dans le cadre d’un contrat (publicité pour des produits, services), etc.
Que faire ? Plusieurs solutions s'offrent à vous :
- Demander aux sites partenaires de faire un lien vers la page canonique définie comme telle ;
- Demander aux sites qui reprennent ce contenu d'insérer une balise à l'intérieur de leur page indiquant aux moteurs qu'ils ne doivent pas les suivre (un noindex ou un fichier Robots.txt).
Dans le cadre d’une campagne de communiqués de presse, que faire ?
- Proposer son communiqué sur un seul site ;
- Ou ne proposer qu'une partie (snippet, accroche et description) en faisant un lien vers la version longue du communiqué sur le site "émetteur" du communiqué de presse.
|