Afin de lutter contre le spam, Wikipedia vient d’ajouter l’attribut rel="nofollow" sur tous ses liens externes. C’est du moins ce qu’annonce Google Blogoscoped, et un simple coup d’oeil sur une page de l’encyclopédie communautaire permet de s’en assurer.

rel=”nofollow” ?

La croissance des blogs depuis 2002 a entraîné une nouvelle pratique dont nombre d’entre vous ont certainement été victimes : le spam de commentaires. Des robots viennent déposer un commentaire contenant des mots clés précis et pointant vers leur URL sur votre blog afin de faire monter leur page rank Google.

La situation est très rapidement devenue incontrôlable, et les causes en sont multiples :

  • Le peu d’outils de blogging différents, qui permet de créer peu de versions des scripts de spam.
  • La quantité de blogs et de wiki sur lesquels il est possible de publier des commentaires et des pages sans authentification (et même avec, ça ne change pas grand chose, particulièrement sur les wiki).
  • L’absence – à l’époque – de solutions de lutte contre le spam efficaces.

Il a donc fallu rapidement trouver une solution, sous peine de voir tout le système du pagerank s’écrouler sur lui-même. C’est le microformat rel="nofollow". La présence de l’attribut “nofollow” dans un lien indique aux outils de recherche que ceux-ci ne doivent en aucun cas suivre le lien donné dans leur récolte. Ce lien externe n’est dont pas pris en compte dans l’indexation de la cible, et les spammeurs en sont pour leurs frais.

La mort du page rank ?

Le pagerank d’un site se base non seulement sur la quantité de liens externes pointant vers lui, mais également sur le pagerank des pages liant ce site. Il y a donc un certain principe de réciprocité : un site fortement lié agira fortement sur le pagerank des sites qu’il met en lien.

En appliquant l’attribut rel="nofollow", Wikipedia vient de casser ce principe de manière inquiétante : l’encyclopédie en ligne possède en effet un très fort pagerank, et chacune de ses pages (23 millions selon Google) est également très bien cotée au point d’apparaître dans les 10 premiers résultats d’à peu près n’importe quelle recherche sensée (je précise pour les petits plaisantins qui chercheraient des choses absurdes ou n’existant pas dans le seul but de me contredire). Elle récupère donc tout le bénéfice de ses liens entrants, sans toutefois rendre la pareille à ceux qui la lient. Et vue l’importance du site, on est en droits de craindre

  • Que ce genre de pratique devienne systématique sur toutes les grosses publications.
  • Que le page rank finisse par perdre complètement sa valeur suite à la sortie de la boucle des sites les mieux cotés.
Perry the Platypus wants you to subscribe now! Even if you don't visit my site on a regular basis, you can get the latest posts delivered to you for free via Email: