Microformats VS RDFA
Frédéric de Villamil
blueKiwi Software
Pourquoi les Microformats ?
- Des peta-octets de contenus présents sur le web mais inexploitables
- Pallier les limites des machines dans la compréhension des contenus
- Pas de sémantique structurelle
- Décrire les contenus non directement indexables
- Extraire des données pertinentes pour les exploiter
[any material that should appear in print but not on the slide]
Que sont les Microformats ?
- Des bouts de code simples visant à rajouter du sens aux contenus
- En HTML ou XHTML standard
- Une transposition en 1:1 de standards ouverts
- Destinés à une application immédiate en grandeur réelle
[any material that should appear in print but not on the slide]
Quelques implémentations
- rel-tag
- rel-nofollow
- hCard : carte de visite électronique (vcard)
- hCalendar : calendrier en ligne (iCal)
- hAtom : publication épisodique (Atom)
- hResume : CV en ligne
[any material that should appear in print but not on the slide]
rel-nofollow
-
<a href="http://toto.com rel='external nofollow'">Toto</a>
- Référencement
- Lutter contre le spam
- Ne pas diluer son pagerank
[any material that should appear in print but not on the slide]
rel-tag
-
<a href="http://toto.com rel='tag'">Toto</a>
- Différent des meta keywords
- Lancé par Technorati en 2005
- Permet d'étiqueter des contenus non indexables
[any material that should appear in print but not on the slide]
hCard
- Transposition à l'identique du standard vCard
- Utilisée afin de donner des informations d'adresses
- Support de la géo localisation
- Prend en compte les adresses privées / professionnelles
[any material that should appear in print but not on the slide]
hCalendar
- Transposition à l'identique du standard iCalendar
- Utilisée afin de donner des informations sur des événements
- Extraction vers le carnet d'adresses
- Problème : mesusage de la balise
abbr
[any material that should appear in print but not on the slide]
hAtom
- Transposition à l'identique du standard Atom
- Destiné aux publications périodiques (journal, blog...)
- Extraction des différents éléments du contenu de manière indépendante
[any material that should appear in print but not on the slide]
hResume
- Pas un microformat mais un macroformat
- Application d'un ensemble de microformats
- Extraction des différents éléments du contenu de manière indépendante
[any material that should appear in print but not on the slide]