Pour le jour de l’Epiphanie, les Rois se sont arrêtés au Monastère, sous la forme d’une petite exposition de représentations de l’Adoration des Mages.
Dans quel lieu est-il possible d’accrocher, en quelques heures, un Giotto, un Botticelli, un Dürer, sans contrainte?
Auteur/autrice : NDuplain
Un des grands chantiers du Web, c’est l’indexation des contenus. Cela signifie que chaque objet d’information: page web, fichier graphique, document, doit recevoir des mots-clés. Dans une banque de données restreinte comme un catalogue de musée ou de bibliothèque, c’est déjà une entreprise délicate. Mais à l’échelle d’Internet, c’est une tâche titanesque. Pourtant la nécessité est claire, si l’on souhaite accéder à l’ensemble des ressources via un moteur de recherche. Les éléments comportant du texte peuvent être indexés et livrer ainsi quelques mots-clés (même si ce n’est pas forcément les termes par lesquels les gens les chercheront). Les images continuent à poser un problème. Les moteurs de recherche d’images fonctionnent habituellement en indexant le nom du fichier et le contenu de la page où l’image est intégrée. Les images étant par nature complexes, on n’obtient pas forcément les mots-clés adéquats. Le recours à l’intelligence humaine semble être encore le meilleur moyen. Mais comment indexer des masses d’images?
Cette question est posée depuis quelques temps sur Internet, notamment grâce à des sites de partage de photos comme Flickr. Sur ce site, celui qui met une image peut insérer des mots-clés. Les autres utilisateurs ont la possibilité de proposer des mots-clés complémentaires, si le propriétaire des images l’autorise.
Exemple d’une image « taggable » dans Flickr
La possibilité de donner des mots-clés à des objets s’appelle le tagging, du terme anglais tag.
Pourquoi cette possibilité de donner des mots-clés alternatifs? C’est essentiel, car on sait que c’est une pratique très subjective. Celui qui a créé l’image est peut-être un connaisseur du sujet: imaginons un botaniste qui prend une photo d’une fleur. Il va en donner le nom scientifique. Mais la plupart des gens utiliseront le terme vernaculaire pour rechercher une image de cette fleur. De plus, ce terme vernaculaire peut changer d’une région à l’autre. On comprend alors l’intérêt de laisser d’autres utilisateurs proposer des mots-clés. Il y a bien entendu le risque d’avoir aussi des termes erronés ou absurdes, mais le bénéfice général est supérieur. Quand on donne la possibilité au public de proposer des mots-clés, on parle de folksonomy ou indexation populaire.
Dans le domaine des musées, on s’est intéressé à la folksonomy. Il y a des expériences en cours, comme le « Art Museum Social Tagging Project » ou Steve. Le site Web du projet présente des oeuvres d’art et des objets archéologiques ou ethnologiques à indexer. Les visiteurs peuvent proposer des mots-clés. Une première analyse des termes proposés par le public montre que 90% des termes proposés ne se trouvent pas dans la documentation du musée relative à aux objets correspondants.
http://www.steve.museum/index.php?optio … &id=51
Cela illustre bien le fossé entre l’indexation savante et les représentations populaires. Et cela fonde la nécessité de l’indexation populaire. Du reste, certains musées jouent déjà le jeu:
– http://www.clevelandart.org
– http://magart.rochester.edu/
Le recours aux foules pour indexer des masses énormes de documents correspond à deux tendances profondes et conjointes du web. Tout d’abord le Web 2.0 et la soif des internautes de participer aux contenus. Wikipédia, l’encyclopédie participative, en est l’exemple-phare. On est passé d’un internaute consommateur, content de trouver de nombreuses données en ligne, à un internaute consomm-acteur, qui souhaite contribuer aux sites qu’il visite, en commentant, en composant des textes, en intégrant des images, etc… La seconde tendance est en fait l’autre face du Web 2.0: les initiateurs de grands projets ont tôt fait de comprendre le parti qu’ils pouvaient tirer de la situation en utilisant le travail de la foule des internautes. On parle alors de « crowdsourcing », un terme forgés sur les termes « crowd » (foule » et out-sourcing. Il y en a de nombreux exemples: cela peut aller de l’utilisation de la puissance de calcul de milliers d’ordinateurs dispersés dans le monde à de la recherche médicale. Certains projets assurent même un revenus à ceux qui y participent.
En l’absence de salaire, comment convaincre les internautes d’indexer des images? Le tagging est une activité modeste et invisible (contrairement à un article dans Wikipédia). Luis von Ahn, un chercheur en informatique, a considéré que la facteur humain était essentiel dans l’informatisation et la numérisation. Il a imaginé qu’un simple jeu pouvait permettre d’indexer une masse considérable d’images. Il a mis au point ESPgame: on joue avec un partenaire attribué par le système. Chacun voit la même image et doit proposer des mots-clés dans un temps limite pour obtenir des points.
Ce jeu a obtenu un grand succès et il a été repris par Google, sous le nom de Google Image Labeler:
http://images.google.com/imagelabeler/
Ainsi, grâce à ce jeu simplissime et pourtant amusant (voire addictif comme tous les jeux à score), Google escompte bien indexer des masses à peine chiffrables d’images et améliorer ainsi les recherches de Google Images.
Alors que le monde physique est marqué par une tendance à l’individualisme, le monde virtuel retrouve l’esprit des bâtisseurs de cathédrale, de la participation à une tâche qui dépasse l’individu. Cet état d’esprit est fondamental pour augmenter les informations sur Internet et les consolider en les rendant plus accessibles. Il est évident que l’indexation est l’une des clés de cette consolidation et qu’elle ne peut pas être le fait d’individus ou d’équipes restreintes et hautement formées.
Cette année, il faudra se montrer encore plus moderne que la Reine d’Angleterre qui a transmis ses voeux de Noël via YouTube. Son message commence du reste par un extrait du message télévisé qu’elle fait prononcé en 1957, montrant son intérêt pour les technologies nouvelles qui, 50 ans plus tard, ne s’est pas démenti:
http://www.youtube.com/watch?v=u0nmkYGCljE
Voici donc une idée qui vous donnera une longueur d’avance. Créez un avatar sur Voki.com et envoyez votre message de nouvel an à vos amis par mail ou même grâce à votre blog:
J’ai opté pour la voix de synthèse, mais il est possible d’enregistrer du son et de l’envoyer sur le site. Détail amusant, l’avatar suit des yeux votre souris (comme dans Second Life).
Picsearch est un nouvel outil pour ceux qui recherchent des images sur Internet. Sur sa page d’entrée, il montre les quatre images les plus populaires de la semaine. Quand on va régulièrement sur le site, on se rend compte que les sujets choisis correspondent, en partie du moins, avec l’actualité.
Autre intérêt de ce site: il propose des termes de recherche proches pour aider l’utilisateur à préciser sa requête.
Comme Google Images, il est basé sur l’indexation du Web. Il ne s’agit donc pas d’un moteur qui analyse les images elles-mêmes.
Picsearch se présente également comme « Family Friendly », dans la mesure où il filtre les contenus pour adulte. Il offre aussi la possibilité les images « offensante » qui se retrouveraient dans son index.
Il est aussi possible d’intégrer une boîte de recherche Picsearch sur son site, en intégrant un simple bout de code HTML:
|
Pour tous ceux qui s’intéressent à l’histoire de l’Europe de l’après-guerre, le site du Centre virtuel de la connaissance sur l’Europe est un passage obligé. Il réunit en effet plus de 15’000 documents, textes, articles de journaux, lettres officielles, photos, vidéos, cartes, etc…
Pour se retrouver dans cette masse de documents, on peut utiliser le moteur de recherche ou passer par le système de navigation qui donne son nom à la banque de connaissance: European NAvigator. Les documents sont rangés chronologiquement (par événements historiques), selon les institutions (Union européenne ou Conseil de l’Europe par exemple). Plusieurs dossiers spéciaux sont également disponibles, dont le plus récent concerne Willy Brandt. On peut aussi se promener dans la médiathèque et retrouver les documents selon leur type (texte, photos, vidéos, …).
Le Thesaurus permet d’accéder à des documents selon des thèmes hiérarchisés. On connaît la complexité du jargon européen. Le site offre donc un lexique définissant les termes importants.
Ce site s’adresse avant tout à un public de connaisseurs: étudiants, chercheurs, enseignants. Il a un système de navigation relativement complexe. L’accès à un document implique parfois l’ouverture de plusieurs fenêtres du navigateur, ce qui est un peu pénible.
On connaît bien le dictionnaire Visuel, qui présente pour des thèmes allant de l’anatomie humaine aux transports en passant par les animaux, des planches précises avec des termes français et anglais. Il permet aussi bien d’étendre le vocabulaire dans sa propre langue que d’apprendre des termes anglais. Disponible aussi en CD-ROM, le Visuel est maintenant en ligne sur Internet.
La version en ligne s’adapte au média. Par rapport au livre, elle offre des animations, des illustrations sonores et même des visualisations en 3D. Elle donne aussi un lien systématique vers Wikipédia, projet dont elle est partenaire officielle. C’est du reste intéressant de connaître les conditions pour un partenariat avec Wikipédia: avoir son propre nom de domaine, ne pas être un site pour adultes et ne contenir aucune publicité pour des sites adultes, atteindre un trafic d’au moins 5 000 visiteurs uniques par jour.
Le Visuel intègre aussi de la publicité, en utilisant le système de Google. Cela donne peut-être une idée de l’encyclopédie que Google est en train de lancer sur le modèle de Wikipédia, sous le nom de Knol (comme knowledge), et dont les articles seront susceptibles de contenir aussi de la pub.
Faut-il diaboliser ce type de publicité. La « réclame » qu’on trouve dans les médias traditionnels nous est imposée. Même si on achète une voiture tous les 10 ans seulement, on doit subir de la publicité pour les voitures entre deux achats. La publicité sur Internet est contextuelle: elle est liée au sujet sur lequel nous effectuons des recherches et peut donc s’avérer utile en nous mettant en contact avec le service dont nous avons besoin. Il ne s’agit pas de messages matraqués, mais d’une micro-pub, de micro-campagnes correspondant au modèle économique de la longue traîne.
Patrimoine portugais
Le site Matriz (Inventário e Gestão de Colecções Museológicas) a pour but de réunir les catalogues des musées portugais dans une interface unique. Il s’insère dans le cadre du programme eEurope et s’est fait sous l’égide de l’Instituto Português de Museus. Plus de 30’000 objets provenant d’environ 25 musées sont accessibles. Il est possible de faire des recherches selon le musée, le domaine, l’artiste, des mots-clés. Les requêtes peuvent également être modulées selon le type d’utilisateur: grand public ou scientifique. Derrière le site se cache, semble-t-il, un système de gestion des collections assez complexe.
La banque de données du site permet aussi de visualiser les objets qui ont été exposés lors d’expositions temporaires. Malheureusement les dates des expositions saisies dans le système laissent penser que le site n’est plus guère entretenu, ou du moins cette partie-là.
http://www.matriznet.ipmuseus.pt/
L’ergonomie est peu efficace. Le site se borne en fait à une interface de requête de banque de données. Il n’y a pas d’outil de valorisation des collections, comme des galeries prédéfinies ou des expositions virtuelles. Vu la quantité d’objets disponibles et leur variété, c’est vraiment dommage. Globalement, dans le domaine de la diffusion culturelle, la mise en ligne d’un catalogue, n’est pas suffisante. Si on veut toucher le grand public, il faut s’intéresser à la visualisation et la valorisation.
Lire des clous
Quand j’étais étudiante, c’est la métaphore qu’on utilisait pour désigner le déchiffrement des inscriptions cunéiformes, provenant de la Mésopotamie ancienne. La communauté des spécialistes de ce domaine est restreinte. C’est peut-être ce qui explique leur empressement à devenir un réseau virtuel sur Internet, afin de partager leurs ressources et leurs connaissances.
La Cuneiform Digital Library Initiative (CDLI) réunit plusieurs institutions de par le monde: instituts universitaires, musées, bibliothèques. Leur but est de mettre à disposition, sur Internet, des textes cunéiformes. Pour chaque enregistrement (au nombre de 200’000), on peut ainsi obtenir une image sous plusieurs angles de la tablette ou une transcription du texte (sous forme de dessin), une transcription en caractères latins ainsi que toute une série de méta-données. On peut cependant regretter l’absence de traduction des textes, qui les mettraient à disposition d’un public plus large que les spécialistes de la Mésopotamie, notamment à disposition de ceux qui étudient les cultures voisines (Egypte, Grèce, …).
Tablette cunéiforme de l’Institut catholique de Paris
En voyant les images de cette tablette, on ne peut s’empêcher que ce type d’objet devrait être disponible en 3D, afin que le lecteur puisse l’orienter dans tous les sens. Il existe du reste des projets qui vont dans ce sens:
http://ieeexplore.ieee.org/Xplore/login … er=1240266
Autre site sur les études orientales:
Le Monastère a enfin rejoint son cadre: le sim Alpine Meadow.
Ses trois principales parties sont presque complètement aménagées, prêtes à recevoir des visiteurs:
La chapelle qui servira de cadre à des expositions
Le cloître avec, en son centre, une fontaine et, pour les fêtes, un sapin décoré
La bibliothèque et le scriptorium
Cet ensemble est l’oeuvre de cinq personnes, venant de pays et même de continents différents. Chacun a apporté ses compétences particulières: construction, textures, scripts, etc.. La collaboration s’est faite naturellement, même si les horaires décalés entre les Etats-Unis et l’Europe ne facilitent pas toujours les choses. Je me souviens que l’une des constructrices arrivait au moment où j’allais me coucher. Nous n’avions qu’un bref moment pour échanger des idées.
La construction du bâtiment ne s’arrête pourtant pas là. Il sera amélioré sans cesse. Nous prévoyons, par exemple, d’y aménager une crypte.
Lien direct (pour ceux qui ont un compte sur Second Life):
Calendrier de l’Avent
Ouvrir les portes d’un calendrier de l’Avent, c’est aussi possible sur Internet. D’un clic de souris, on découvre des images censées nous préparer à Noël ou bien à calmer notre impatience à l’idée de déballer ses cadeaux sous le sapin.
Deux blogs s’associent pour offrir ce calendrier, Be virtual et Archéofacts. Il est consacré à l’archéologie, d’où son nom de « Calendrier de l’Avant ». Jour après jour, le calendrier fera découvrir à ses visiteurs les traces, les vestiges, les débris que les archéologues exploitent pour mieux connaître le passé de l’homme.
Une porte chaque jour, et gare à ceux qui se montrent trop curieux!