Duplication de contenu : les “canonicals tags” à la rescousse…

Sur le Web, on retrouve fréquemment des contenus dupliqués à savoir une copie identique ou très proche du contenu d’une page sur une autre.

Il y a donc plusieurs URL, mais qui comporte en substance exactement la même information.

Cela peut se produire car un site reprend un contenu pertinent d’une page sur une autre page à titre légitime, ou bien il s’agit d’une technique pour gonfler artificiellement son contenu et essayer de favoriser son positionnement dans les moteurs.

Problème: les moteurs de recherche, dans un souci de qualité, souhaitent épurer leur index de tout doublon. Ils effectuent un choix et ne présentent dans leurs résultats qu’une seule source, et pas forcément la bonne. Les moteurs peuvent également décider au final de pénaliser un site qui abuse de la technique. La plupart des gros acteurs du web, et en particulier les sites e-commerce du web qui ont énormément de contenu dupliqué attendait une solution technique pour gérer au mieux cette problématique.
Les principaux moteur de recherche viennent enfin d’apporter une solution, sous la forme d’un nouveau tag: le ‘canonical tag’

C’est assez rare pour être souligné, mais Google, Yahoo et Microsoft se sont mis d’accord pour utiliser le même procédé.
Il s’agit en fait de donner l’information aux robots qui crawlent le web qu’une page en particulier est la version originale (la page “canonique”) et que du coup, les autres ne sont que des référents.

L’implémentation du tag est simplissime - il suffit de spécifier dans le <Head> la page originale comme ceci:

<link rel=”canonical” href=”http://www.example.com/product.php?item=swedish-fish”/>

Il est certain que cette solution ne va pas résoudre tous les problèmes de contenu dupliqué qu’on peut trouver sur le Web, mais c’est un pas dans la bonne direction et qui était attendu par les professionnels depuis un bon moment.

Pour plus d’information, notamment technique, voir ici (en anglais)

Tags: , ,

6 commentaires pour “Duplication de contenu : les “canonicals tags” à la rescousse…”

  1. drloser dit :

    Qu’est-ce qui empêche tout le monde (copieurs y compris) de mettre ce tag dans sa page ?

  2. zejulio dit :

    Héhé, je vois que tu as toujours le cerveau aussi vif !

    En effet, rien n’empêche un copieur de déclarer que sa page est l’originale - c’est pour cela que j’ai dit que cela ne résoudra pas tout

    Mais l’utilité est surtout pour un site qui duplique son contenu à plusieurs endroit et qui pourra de lui-même déclarer où est l’original

  3. jye dit :

    Cette mesure est vraiment destiné au duplicate content au sein d’un même site, tu ne met pas ce point assez en valeur à mon gout. D’où la réaction de drloser.

    C’est quand même un plaie de mettre en place ce tag à mon avis sur des sites comme clubic (au hasard, vraiment) qui est à mon avis le genre de site qui est sujet au duplicate content.

  4. zejulio dit :

    Le procédé est encore tout nouveau et va mettre du temps à se mettre en place.

    Tu as parfaitement raison pour clubic, et autres sites de contenu rédactionnel (comme ceux des groupes jdn, m6, BOM, etc…) qui sont des spécialistes.
    Les sites e-commerce sont également très concernés.

    A priori, pour l’aspect technique, il y a quand même déjà un certain nombre de plug-in en développement pour beaucoup de plateformes : http://www.google.fr/search?q=canonical+plugin
    > Je regardais justement un tel plugin pour magento ce matin au taf…

  5. LeGreg dit :

    De toute façon, même si le copiteur était honnête seuls les canonical tags dans le même domaine sont autorisés. (donc http://www.copietruc.com ne peut pas indiquer http://www.truc.com comme “lien canon”).

  6. ATP dit :

    jye a dit :
    Cette mesure est vraiment destiné au duplicate content au sein d’un même site, tu ne met pas ce point assez en valeur à mon gout. D’où la réaction de drloser.

Laisser un commentaire

Si vous avez un compte sur WeFrag, connectez-vous pour publier un commentaire.

Vous pouvez, entre autres, utiliser les tags XHTML suivant :
<a href="" title="">...</a>,<b>...</b>,<blockquote cite="">...</blockquote>,<code>...</code>,<i>...</i>