Frederic de Villamil


, , , , , , , ,


Partagez sur Twitter Partagez sur Facebook Partagez sur Google Plus Partagez sur Linkedin Plus

Microformats 2.0, standards et conservation de la mémoire au dîner Microformats Paris

J’étais hier soir au dîner Microformats, organisé par Christophe Ducamp à l’occasion de la venue à Paris de Tantek Celic. Si je vous en parle, ce n’est pas (seulement) pour me la péter genre je connais des stars du Web, ni pour vous dire que je me suis fait péter le bide dans un très bon japonais, mais parce que certains sujets de conversation valent la peine d’être rapportés.

Microformats.org

Si vous n’avez jamais entendu parler des Microformats, il s’agit de portions de HTML permettant de signifier du sens à des outils de parsing comme des moteurs de recherche. Ils cherchent en priorité à reproduire les protocoles ouverts existants, comme vCard, iCalendar… J’en ai énormément parlé à une époque, aussi je vous invite à lire mes articles traitant des Microformats pour de plus amples informations.

<typo:code lang=”html” title=”Exemple de Microformat décrivant un événement”> Dîner Microformats le 03-02-2012 au restaurant Yamamoto 6 rue Chabanais 75002 PARIS. </typo:code>

L’adoption des Microformats a véritablement explosé depuis l’époque où j’évangélisais de Barcamp en Barcamp, jusqu’à l’atelier donné avec David Larlet à Paris Web 2008. La prise en compte – enfin – des Microformats par Google sous le nom de Rich Snippets, mais également leur intégration dans de nombreux thèmes Wordpress ou templates gratuits sont loin d’y être étranger. Ils ne posent donc plus de problèmes de référencement, ce qui était un des principaux reproches qui leur étaient fait.

L’autre reproche était une utilisation abusive et erronée de l’attribut title de la balise html <abbr> dans hCalendar. Ce problème a également été résolu. Cela n’empêche pas la version 2 des Microformats de détourner l’attribut class à des fins sémantiques, problème soulevé par Daniel Glazman lors d’une conversation avec Olivier Gendrin à la soirée Paris Web 2007. L’argument de Tantek à ce sujet est que les designers les plus célèbres, notamment autour du CSS Zen Garden ont commencé à mettre de la sémantique dans leurs class dès 2001 / 2002 : nav, header, footer… C’est probablement d’ailleurs cet usage qui a conduit à l’introduction des balises éponymes dans HTML5.

L’autre problème abordé est celui de la reconnaissance sémantique. Vaut-il mieux définir une grammaire comme les Microformats (ou le RDFA), ou faire des pages d’expressions rationnelles pour trouver du sens dans le langage naturel ? Le problème vient évidemment du risque de faux positifs, parce que la manière d’écrire un nom, une adresse, dépend des cultures et de la langue utilisée. Si c’est relativement standardisé dans les pays européens et anglo-saxons, les choses se compliquent dès qu’on attaque l’Asie et les pays Arabes. À ce sujet, l’exemple du parsing des dates sur l’iPhone est symptomatique : une date au format 2012-02-01 est interprétée comme un numéro de téléphone, et non comme une date. Pourquoi ? Parce que sur un téléphone, les probabilités que les gens cliquent sur un numéro de téléphone sont bien plus grandes que sur une date.

Nous avons enfin abordé le problème de la conservation de la mémoire, notamment à l’occasion des Barcamps (Tantek a lancé les Barcamps l’année où Tim O’Reilly a oublié de l’inviter au FOO Camp). Tantek recommande l’utilisation de bloc notes collaboratifs. Je suis plus pour que des volontaires acceptent de retranscrire la conversation en live, afin de permettre aux autres d’y participer sans passer leur temps sur leur ordinateur ou leur tablette. À ce propos, l’expérience LeWeb m’a montré l’importance fondamentale – et la difficulté du live blogging, mais je vous en parlerai une autre fois.

Et évidemment, j’en ai profité pour ressortir mon Carl Zeiss 85 1.4, et c’est toujours un bonheur.