Dans une encyclopédie, les connaissances sont présentées sous forme d’articles reliés entre eux par des liens ou des mots-clés. Il ne s’agit pas de données structurées. Les encyclopédies se prêtent donc bien à une transposition sur Internet sous forme de wiki, c’est-à-dire un système d’hypertexte collaboratif.
Depuis peu, les données structurées sont aussi devenues compatibles avec le Web 2.0. Il s’agit de données organisées selon un système hiérarchique et avec, pour chaque donnée, des informations obéissant à une certaine structure, des banques de données en somme. Il est désormais possible de publier des données et de participer à leur structuration sur le site Freebase.
Sur ce site, il est possible (pour peu que l’on ait ouvert un compte gratuit) de:
- ajouter des données à des séries déjà existantes. Le système compte actuellement plus de 20′000 livres, 38′000 films, 5000 bâtiments, 1000 vins et 60 fromages (là il y a encore un grand effort à faire).
- discuter de questions concernant la structuration des données. Parmi les discussions en cours, on peut en relever une consacrée aux types de musées.
- structurer les données
Freebase est aussi un système ouvert vers l’extérieur. Il est possible d’en réutiliser les données dans des applications, des sites web, des widgets. Parmi les réussites, on peut noter certaines réalisations:
- Archiportal : Les bâtiments listés et décrits dans Freebase sont représentés sur une carte (Google Map)
Bâtiments de la ville de Rome présents dans Freebase - History of sciences : une frise chronologique présentant les savants qui ont joué un rôle important dans le développement de la science, d’Anaximandre à nos jours. Un lien permet de retourner sur la notice complète dans Freebase.
Ces deux exemples montrent bien que l’un des enjeux du Web actuel est l’interopérabilité entre systèmes. Cela permet de créer des visualisations performantes des données, sur une échelle de temps ou une carte de géographique. Chacun trouve son rôle dans un prochain: ajouter des données, programmer des interfaces, etc …
Cette étape de la structuration des données me semble essentiel. Des quantités incroyables de données ont été numérisées et mises à disposition sur Internet. Il faut maintenant s’occuper de leur gestion. Freebase se nourrit de Wikipédia, car il reprend de nombreuses descriptions, mais il offre une dimension supplémentaire: une hiérarchie , un classement des données.