Je suis tombé récemment sur deux chiffres extrêmement intéressants concernant l’utilisation des tags dans les outils de publication sur le web, et sur les pratiques afférentes.

Le premier a été publié par Yahoo lors du WWW2008 de Pékin et concerne son service de bookmarking social Delicious, où 90% des utilisateurs et 95% des bookmarks sont rassemblés sous moins de 2000 tags, ce qui fait à la fois beaucoup et très peu.

Le second vient d’une présentation faite par Garrick Schmitt à l’IA Summit 2008 et concerne l’utilisation de la navigation par tags par les visiteurs de sites web : 87,8% d’entre eux n’ont jamais navigué à l’aide d’un nuage de tags ou ne le font jamais, et seuls 12.2% d’entre eux les utilisent régulièrement.

Les chiffres de Delicious sont intéressants à bien des égards. Si 2000 tags semblent beaucoup dans l’absolue, ce nombre est en fait extrêmement faible, et dû à trois facteurs :

Les utilisateurs de Delicious ont globalement des centres d’intérêts proches. Une étude sémantique sur les tags utilisés permettrait de déterminer à quel point, cependant, la liste des 10 tags les plus populaires est déjà relativement parlante :

  1. Design.
  2. Blog.
  3. Webdesign.
  4. Web 2.0
  5. Software.
  6. Tools
  7. Programming.
  8. Music.
  9. Art.
  10. Vidéo.

Cette communauté restreinte explique d’ailleurs également en partie les chiffres de Garrick Schmitt, mais pas totalement.

Parce qu’ils ont cette culture web – on pourrait presque parler de culture geek – les tags sont très majoritairement placés en langue anglaise. Cela permet de réduire le nombre de tags utilisés tout en assurant une certaine harmonisation qui facilite le suivi des documents mis en favoris via les flux RSS associés.

Enfin, delicious offre à ses utilisateurs une saisie prédictive des tags, de trois manières différentes :

  • Suggestion des tags les plus populaires apposés au lien sauvegardé, quand ils existent.
  • Suggestion des tags déjà présents dans mes favoris en rapport avec le document à sauvegarder.
  • Autocomplétion des tags proposés et des tags déjà utilisés dans mes bookmarks.

Cette suggestion, si elle est fort pratique, ne pousse pas à l’inventivité ni à la l’élargissement du spectre des tags utilisés de manière plus globale. Elle n’explique pas non-plus la très faible utilisation des tags selon Schmitt, lequel, au passage, ne donne aucune information sur le spectre de la population interrogée.

En partant du principe qu’il s’agit d’une population d’internautes “normal”, comprenant plus de Madame Michu que je power users, je vois trois raisons quant à cette désaffection.

  1. Un usage trop nouveau et trop spécialisé pour être massivement adopté.
  2. Une utilisation non pertinente des tags.
  3. Une absence de mise en valeur du nuage de tags.

Le microformat rel=”tag” a été créé seulement mi 2005 par le moteur de recherche Technorati, afin d’affiner l’analyse sémantique des données collectées sur les blogs. Moins de trois ans plus tard, son adoption par les producteurs de contenus est déjà extraordinaire. L’usage qui en est fait est pourtant globalement maladroit ou erroné, le plus souvent par ignorance. Au delà de ce problème, le tag reste, comme le flux RSS, un outil de spécialiste de la recherche et de la veille, qui s’intéresse à des domaines spécifiques, et a donc des besoins de filtrage très pointus.

Pourtant, même les power users les plus acharnés avec lesquels j’ai pu discuter, parmi lesquels bon nombre de documentalistes formés aux outils du web 2.0 ne les utilisent qu’avec une grande réticence, et en dernier recours ou en complément d’éléments de filtrage croisés. Ils considèrent en effet que les tags sont le plus souvent utilisés de manière peu voire pas du tout pertinente, car leurs producteurs

  1. ne savent pas comment les utiliser.
  2. utilisent uniquement les “buzz words” du moment afin de générer du trafic. Cette pratique est particulièrement visible sur les blogs traitant de marketing viral.
  3. les utilisent volontairement de manière erronée afin de tromper les moteurs de recherche et les outils d’indexation, en un mot pour faire du SPAM.

Enfin, les nuages de tags sont trop peu souvent mis en valeur comme il le faudrait.

  • Les tags les plus utilisés devraient être matérialisés par une police de caractère plus grosse que les tags les moins importants.
  • Le nombre de tags affichés sur le nuage doit être suffisamment important pour que la classification soit pertinente.
  • La place accordée au nuage de tags doit être suffisante importante pour que ce dernier soit lisible. À cet égard, je vous recommande celui de Bertrand Duperrin qui est un modèle du genre.

L’usage de la taxinomie sur le web est loin d’être répandue et très loin de devenir une généralité. La spécificité de ses communautés d’utilisateurs, le fait qu’il soit un outil de spécialiste, et son utilisation peu pertinente sont autant de freins à son développement. Quant à son utilisation dans le spam, il risque bien de la tuer avant même son adoption par les grands outils de recherche généralistes.

cloche

Perry the Platypus wants you to subscribe now! Even if you don't visit my site on a regular basis, you can get the latest posts delivered to you for free via Email: