Catégories
Bibliothèque virtuelle Communautés virtuelles Jeux Musée virtuel Tendances

Appel à la foule

Un des grands chantiers du Web, c’est l’indexation des contenus. Cela signifie que chaque objet d’information: page web, fichier graphique, document, doit recevoir des mots-clés. Dans une banque de données restreinte comme un catalogue de musée ou de bibliothèque, c’est déjà une entreprise délicate. Mais à l’échelle d’Internet, c’est une tâche titanesque. Pourtant la nécessité est claire, si l’on souhaite accéder à l’ensemble des ressources via un moteur de recherche. Les éléments comportant du texte peuvent être indexés et livrer ainsi quelques mots-clés (même si ce n’est pas forcément les termes par lesquels les gens les chercheront). Les images continuent à poser un problème. Les moteurs de recherche d’images fonctionnent habituellement en indexant le nom du fichier et le contenu de la page où l’image est intégrée. Les images étant par nature complexes, on n’obtient pas forcément les mots-clés adéquats. Le recours à l’intelligence humaine semble être encore le meilleur moyen. Mais comment indexer des masses d’images?
Cette question est posée depuis quelques temps sur Internet, notamment grâce à des sites de partage de photos comme Flickr. Sur ce site, celui qui met une image peut insérer des mots-clés. Les autres utilisateurs ont la possibilité de proposer des mots-clés complémentaires, si le propriétaire des images l’autorise.


Exemple d’une image « taggable » dans Flickr

La possibilité de donner des mots-clés à des objets s’appelle le tagging, du terme anglais tag.
Pourquoi cette possibilité de donner des mots-clés alternatifs? C’est essentiel, car on sait que c’est une pratique très subjective. Celui qui a créé l’image est peut-être un connaisseur du sujet: imaginons un botaniste qui prend une photo d’une fleur. Il va en donner le nom scientifique. Mais la plupart des gens utiliseront le terme vernaculaire pour rechercher une image de cette fleur. De plus, ce terme vernaculaire peut changer d’une région à l’autre. On comprend alors l’intérêt de laisser d’autres utilisateurs proposer des mots-clés. Il y a bien entendu le risque d’avoir aussi des termes erronés ou absurdes, mais le bénéfice général est supérieur. Quand on donne la possibilité au public de proposer des mots-clés, on parle de folksonomy ou indexation populaire.
Dans le domaine des musées, on s’est intéressé à la folksonomy. Il y a des expériences en cours, comme le « Art Museum Social Tagging Project » ou Steve. Le site Web du projet présente des oeuvres d’art et des objets archéologiques ou ethnologiques à indexer. Les visiteurs peuvent proposer des mots-clés. Une première analyse des termes proposés par le public montre que 90% des termes proposés ne se trouvent pas dans la documentation du musée relative à aux objets correspondants.

http://www.steve.museum/index.php?optio … &id=51

http://www.steve.museum/

Cela illustre bien le fossé entre l’indexation savante et les représentations populaires. Et cela fonde la nécessité de l’indexation populaire. Du reste, certains musées jouent déjà le jeu:

http://www.clevelandart.org
http://magart.rochester.edu/

Le recours aux foules pour indexer des masses énormes de documents correspond à deux tendances profondes et conjointes du web. Tout d’abord le Web 2.0 et la soif des internautes de participer aux contenus. Wikipédia, l’encyclopédie participative, en est l’exemple-phare. On est passé d’un internaute consommateur, content de trouver de nombreuses données en ligne, à un internaute consomm-acteur, qui souhaite contribuer aux sites qu’il visite, en commentant, en composant des textes, en intégrant des images, etc… La seconde tendance est en fait l’autre face du Web 2.0: les initiateurs de grands projets ont tôt fait de comprendre le parti qu’ils pouvaient tirer de la situation en utilisant le travail de la foule des internautes. On parle alors de « crowdsourcing », un terme forgés sur les termes « crowd » (foule » et out-sourcing. Il y en a de nombreux exemples: cela peut aller de l’utilisation de la puissance de calcul de milliers d’ordinateurs dispersés dans le monde à de la recherche médicale. Certains projets assurent même un revenus à ceux qui y participent.
En l’absence de salaire, comment convaincre les internautes d’indexer des images? Le tagging est une activité modeste et invisible (contrairement à un article dans Wikipédia). Luis von Ahn, un chercheur en informatique, a considéré que la facteur humain était essentiel dans l’informatisation et la numérisation. Il a imaginé qu’un simple jeu pouvait permettre d’indexer une masse considérable d’images. Il a mis au point ESPgame: on joue avec un partenaire attribué par le système. Chacun voit la même image et doit proposer des mots-clés dans un temps limite pour obtenir des points.

http://www.espgame.org/

Ce jeu a obtenu un grand succès et il a été repris par Google, sous le nom de Google Image Labeler:

http://images.google.com/imagelabeler/

Ainsi, grâce à ce jeu simplissime et pourtant amusant (voire addictif comme tous les jeux à score), Google escompte bien indexer des masses à peine chiffrables d’images et améliorer ainsi les recherches de Google Images.

Alors que le monde physique est marqué par une tendance à l’individualisme, le monde virtuel retrouve l’esprit des bâtisseurs de cathédrale, de la participation à une tâche qui dépasse l’individu. Cet état d’esprit est fondamental pour augmenter les informations sur Internet et les consolider en les rendant plus accessibles. Il est évident que l’indexation est l’une des clés de cette consolidation et qu’elle ne peut pas être le fait d’individus ou d’équipes restreintes et hautement formées.

Catégories
Tendances

Une idée originale pour envoyer ses voeux

Cette année, il faudra se montrer encore plus moderne que la Reine d’Angleterre qui a transmis ses voeux de Noël via YouTube. Son message commence du reste par un extrait du message télévisé qu’elle fait prononcé en 1957, montrant son intérêt pour les technologies nouvelles qui, 50 ans plus tard, ne s’est pas démenti:

http://www.youtube.com/watch?v=u0nmkYGCljE

Voici donc une idée qui vous donnera une longueur d’avance. Créez un avatar sur Voki.com et envoyez votre message de nouvel an à vos amis par mail ou même grâce à votre blog:

J’ai opté pour la voix de synthèse, mais il est possible d’enregistrer du son et de l’envoyer sur le site. Détail amusant, l’avatar suit des yeux votre souris (comme dans Second Life).

http://www.voki.com

Catégories
Général Tendances Usages

Un moteur de recherche d’images

Picsearch est un nouvel outil pour ceux qui recherchent des images sur Internet. Sur sa page d’entrée, il montre les quatre images les plus populaires de la semaine. Quand on va régulièrement sur le site, on se rend compte que les sujets choisis correspondent, en partie du moins, avec l’actualité.

Autre intérêt de ce site: il propose des termes de recherche proches pour aider l’utilisateur à préciser sa requête.
Comme Google Images, il est basé sur l’indexation du Web. Il ne s’agit donc pas d’un moteur qui analyse les images elles-mêmes.
Picsearch se présente également comme « Family Friendly », dans la mesure où il filtre les contenus pour adulte. Il offre aussi la possibilité les images « offensante » qui se retrouveraient dans son index.
Il est aussi possible d’intégrer une boîte de recherche Picsearch sur son site, en intégrant un simple bout de code HTML:

http://www.picsearch.com/

Catégories
Culture Musée virtuel Tendances

Patrimoine portugais

Le site Matriz (Inventário e Gestão de Colecções Museológicas) a pour but de réunir les catalogues des musées portugais dans une interface unique. Il s’insère dans le cadre du programme eEurope et s’est fait sous l’égide de l’Instituto Português de Museus. Plus de 30’000 objets provenant d’environ 25 musées sont accessibles. Il est possible de faire des recherches selon le musée, le domaine, l’artiste, des mots-clés. Les requêtes peuvent également être modulées selon le type d’utilisateur: grand public ou scientifique. Derrière le site se cache, semble-t-il, un système de gestion des collections assez complexe.
La banque de données du site permet aussi de visualiser les objets qui ont été exposés lors d’expositions temporaires. Malheureusement les dates des expositions saisies dans le système laissent penser que le site n’est plus guère entretenu, ou du moins cette partie-là.


http://www.matriznet.ipmuseus.pt/

L’ergonomie est peu efficace. Le site se borne en fait à une interface de requête de banque de données. Il n’y a pas d’outil de valorisation des collections, comme des galeries prédéfinies ou des expositions virtuelles. Vu la quantité d’objets disponibles et leur variété, c’est vraiment dommage. Globalement, dans le domaine de la diffusion culturelle, la mise en ligne d’un catalogue, n’est pas suffisante. Si on veut toucher le grand public, il faut s’intéresser à la visualisation et la valorisation.


Instituto Português de Museus

Catégories
Culture Homère Science Tendances

e-Iliade

Je me dois, de temps en temps, de donner des nouvelles de projets que j’ai présentés dans ce blog. En voici qui me tient particulièrement à coeur. Souvenez-vous! Je vous ai parlé de savants américains qui ont débarqué avec du matériel high-tech dans la vénérable bibliothèque Saint-Marc à Venise, afin de scanner les plus anciens manuscrits contenant le texte de l’Iliade d’Homère.

Homère 3D

Quelques mois plus tard, ces manuscrits sont en ligne et chacun peut se promener à l’intérieur. Je dis bien « promener »: les responsables du projet multi-Homère ont repris le système de navigation de Google Map pour permettre aux utilisateurs de lire les différents manuscrits, de se déplacer sur une page, de zoomer pour en agrandir ou en diminuer les caractères.

Même si on ne lit pas le grec, cela vaut la peine d’aller s’y balader, dans ces manuscrits. La qualité de la numérisation est si bonne qu’on perçoit le relief du parchemin. Avec cet outil, plus jamais on ne lira Homère comme avant. Les étudiants et les chercheurs pourront directement s’y reporter plutôt que de se fier à l’apparat critique. Il pourront eux aussi faire leur propre lecture du texte.
Il faut en effet savoir que les textes antiques nous sont parvenus à travers des manuscrits médiévaux qui ont été copiés pendant des siècles dans les monastères. Quand on dispose, pour une oeuvre, de plusieurs manuscrits, il faut les collationner, c’est-à-dire les comparer entre eux. A cela peuvent s’ajouter aussi les citations de parties du texte dans des auteurs antiques ainsi que des sources papyrologiques. Avec l’ensemble de ces documents, on reconstruit un texte qu’on imagine le plus proche de ce que l’auteur a pu écrire. Pour reprendre le jargon cher à ce blog, on actualise un texte virtuel.
Pendant des générations, il a fallu faire confiance à des éditeurs de texte qui avaient pu lire directement le texte sur parchemin ou qui avaient travaillé sur des photos. Aujourd’hui, l’accès à ces documents est direct et ouvert à tous. Ces documents sont sous licence Creative Commons, autorisant tout le monde à les utiliser et à les retravailler, pour autant que la source soit mentionnée et en dehors de toute utilisation commerciale.

Accès au manuscrit: http://chs75.harvard.edu/manuscripts/index.html?ms=u4

Site du projet Homer Multitext Project (Harvard’s Center for Hellenic Studies): http://chs.harvard.edu

Catégories
Applications géographiques Tendances

Cartographie 2.0

Internet donne à chacun la possibilité d’éditer des cartes, comme en témoigne le site GeoCommons. On peut y importer des données ou en exporter: tout ce qui est mis sur le site est à disposition de chacun sous une licence Creative Commons. Avec les données disponibles, il est possible d’éditer ce qu’on appelle des « heat maps », c’est-à-dire des cartes de répartitions avec un effet « chaleur ». Les endroits avec des concentrations les plus importantes apparaissent comme les plus chauds.

Pour voir comment cela fonctionne, on peut prendre l’exemple d’un jeu de données provenant d’un relevé officiel, mais elles ont été intégrées dans le système par un auteur anonyme. Grâce à ce jeu de données, il est possible de produire des cartes de répartition des travailleurs selon le sexe et le domaine de travail, dans la région de Los Angeles, en 2000. On choisit la catégorie et obtient un résultat (en prévisualisation):


Femmes travaillant dans le domaine du nettoyage (lieu de travail)


Travailleurs des deux sexes travaillant dans le domaine de l’informatique (lieu de travail)

Ces cartes donnent une idée de la répartition des activités dans une zone données.

Descriptif des données: http://www.geocommons.com/data_set/show/1420

Avec ce jeu de données, il est ensuite possible de créer une carte pour laquelle on a un lien permanent:

http://www.geocommons.com/workspace/show/5173

En l’occurrence, il s’agit de la répartition des places de travail dans le domaine de l’informatique.

Pour l’instant, il ne semble pas possible d’importer ces cartes sur un autre site. De plus, le design est très limité: on n’a pas la possibilité de choisir une gamme de couleurs plus élargie ou différente pour le layer indiquant la densité. Manque aussi, pour les visiteurs du site, la possibilité de commenter les cartes. Seul le nombre de téléchargement des données est accessible et constitue un indicateur de l’intérêt de ces données. En revanche, l’application assure une traçabilité des cartes dans la mesure où le lien avec le jeu de données est toujours présent.
Il s’agit d’une application Web 2.0, mais elle suppose un certain savoir-faire, pas tellement en informatique, mais plutôt dans le domaine de l’intelligence des données.
Il faut aussi savoir manipuler les données géographiques pour créer les fichiers au format KML.

Avec ce genre d’applications, on assiste peut-être à évolution dans le domaine du Web 2.0. En effet, les premières applications étaient très simples et pouvaient être utilisées par tout le monde (pour peu que l’on sache écrire): blogs, wikis. Mais les applications comme GeoCommons s’adressent plutôt à des spécialistes. L’avantage est bien entendu que ces spécialistes disposent d’outils gratuits permettant de créer des produits de qualité.

Catégories
Applications géographiques Musée virtuel Science Tendances Usages

Festival de cartes

A Chigaco vient de s’ouvrir le Festival des cartes, un ensemble de manifestations réunissant une trentaine d’institutions de la ville: instituts de recherche, musées, écoles et même la vénérable Encyclopaedia Britannica. Autant d’expositions à découvrir pour le public.

http://www.festivalofmaps.com/ (site Flash uniquement)

Le site du Festival présente une certaine cohérence avec le thème puisqu’on y navigue à l’aide d’une carte dynamique de la ville. Les points mènent sur les fiches d’événements qui conduisent eux-mêmes vers les sites des institutions. C’est une manière agréable de découvrir les sites Internet des musées de Chicago dont certains recèlent de grandes richesses. Par exemple:

http://speculum.lib.uchicago.edu/

Ce que montrent toutes ces expositions, c’est l’importance de la carte géographique, un type de document riche en informations. Il n’a pas fallu beaucoup de temps pour qu’Internet accorde aux représentations géographique une place essentielle: Google Map et Google Earth, Yahoo Map et même la géographie « imaginaire » de Second Life constituent autant de manières de se mouvoir dans le monde virtuel et d’accéder à des informations.

Catégories
Culture Musée virtuel Tendances

Tableau de bord

Les musées publient habituellement sur leurs sites Web des informations pratiques ainsi que les collections. Certains essaient aussi de montrer comment leur institution fonctionne. Ce type d’information n’est pas toujours simple à présenter et il peut sembler parfois rébarbatif. Le Musée d’art d’Indianapolis a opté pour un tableau de bord. Ce dernier est construit à partir d’un système d’indicateurs, probablement utilisés pour sa gestion. Il présente ces indicateurs sous la forme d’un chiffre et d’une icône. En cliquant sur le lien pour avoir plus d’informations, on obtient la définition de l’indicateur ainsi que la précédente valeur. Les visiteurs du site ayant un compte peuvent même commenter ces chiffres.

Ainsi il est possible d’avoir des indications dans les domaines les plus divers du fonctionnement: de la consommation électrique aux finances, en passant par le nombre de visiteurs du musée ou du site, les objets prêtés, nouvellement exposés ou acquis. Il est aussi possible de savoir le temps consacré à l’expertise des oeuvres ou à leur restauration. La courbe des visiteurs est actualisée toutes les 5 minutes.
Ces indicateurs donnent au visiteur une idée de la complexité d’une institution muséale. Ils apportent une certaine transparence sur ses activités et peuvent servir à justifier les budgets publics demandés. Ils obligent bien entendu le musée à maintenir ses efforts de gestion.
Aussi bien les contenus que l’aspect graphique invitent à la lecture. Il semble bien que les muséographes aient cherché à appliquer certaines de leurs recettes dans cette partie du site. Il n’y a d’ailleurs pas que les musées qui pourraient s’inspirer d’un tel exemple.

http://dashboard.imamuseum.org/

Catégories
Culture Tendances

Qui sont les pirates?

Le Tribunal fédéral, en Suisse, a décidé récemment que les baladeurs numériques, les magnétoscopes à disque dur et les appareils semblables seront taxés. Selon le journal de la Fédération romande des consommateurs, le prix de ces appareils augmentera d’une somme allant de 12 à 90 frs, la taxe étant proportionnelle à la capacité.
De fait, l’utilisateur honnête paiera à deux reprises des droits d’auteur, d’abord en achetant un CD ou en téléchargeant légalement de la musique sur Internet, puis en acquérant un Ipod pour les écouter. La copie privée est légale, à certaines conditions. Les supports enregistrables, cassettes, CD-ROM, DVD, sont déjà frappés d’une taxe. Mais il s’agit de simples supports. Il en va tout autrement des lecteurs MP3, qui ne comportent pas seulement un support, mais également le système informatique permettant de les lire. Dès lors leur assimilation à un simple support est un peu excessive. En effet, quand on télécharge de la musique sur Internet, il est quasi implicite qu’on l’écoutera sur un baladeur MP3. La copie sur le baladeur via l’ordinateur n’est qu’un geste technique. On met toujours en avant la facilité de copier et les pratiques dites pirates (téléchargements illégaux sur Internet) pour justifier en arrière-fond ces doubles taxations. A la fin, c’est toujours le consommateur qui est le perdant. On est en droit de se demander qui sont les pirates.

Personne ne conteste le fait que les artistes doivent pouvoir générer des revenus avec leurs oeuvres. Il faut cependant admettre que les recettes appliquées depuis longtemps ne sont plus vraiment adaptées à la nouvelles donne. Internet et les technologies numériques ont profondément bouleversé les habitudes de consommation et il faut savoir en tenir compte. Les artistes et ceux qui essaient de défendre réellement leurs activités seraient bien inspirés de lire le livre d’Alban Martin, « L’âge de Peer : Quand le choix du gratuit rapporte gros ».

Cet ouvrage montre de manière convaincante comment l’offre gratuite peut servir d’amorce à la consommation de produits achetés, comme des CD, des CD collectors, des billets de concerts. Il va cependant beaucoup plus loin en assurant que l’avenir est dans la co-création de valeurs, un processus qui met en jeu aussi bien les artistes, les société productrices d’un côté, que les auditeurs/consommateurs. Ces derniers peuvent donner leur avis, interagir avec les artistes, avoir accès direct à l’univers de leurs groupes et chateurs préférés (sites Web exclusifs, accès aux différentes étapes de la production d’un CD, etc…). Ils peuvent aussi être partie prenante dans la création d’une oeuvre, soit en la produisant (l’auteur donne des exemples d’albums produits par des fans), soit en retravaillant les morceaux. Cette dernière pratique, courante dans certains domaines musicaux, suppose une conception différente des droits d’auteurs.
Ce livre montre que l’avenir de la musique, autant dans sa consommation que dans sa production, est à réinventer. C’est le défi lancé aussi bien aux artistes qu’à leurs admirateurs, qui ne souhaitent plus être réduits à de simples consommateurs.

http://www.frc.ch/communique-news.php?id_com=257

http://www.suisa.ch/home_f.htm

http://www.amazon.fr/L%C3%A2ge-Peer-Qua … 2744062464

Catégories
Tendances

Press 2.0 ou presque

La presse sur Internet s’enrichit et s’affranchit peu à peu des titres imprimés. Voici quelques adresses de sites récents.
Les trois premiers titres sont assez semblables du point de vue de leur fonctionnement: les contenus peuvent provenir d’une rédaction ou des utilisateurs (qui doivent créer un compte pour publier). Les nouvelles sont mises en évidence de diverses manières: tags (mots-clés), articles les plus lus, derniers articles postés. Tous les sujets (petits et grands) sont traités et on colle d’assez près à l’actualité.

Rue89

Ce site d’information a été créé par trois journalistes de Libération. Le style est un peu criard: gros titres écrits en rouge et noire, photos chocs.

http://www.rue89.com/

lepost.fr

Plus calme. Le style fait plutôt penser à flickr.com, dans le rose et bleu.

http://www.lepost.fr/

Le Web 2.0 au féminin

Dans Ladiesroom, les femmes se parlent entre copines, mêlant sujets sérieux et badinages. Le site est écrit par ses utilisatrices.

http://www.ladiesroom.fr/

nonfiction.fr

Ici on change de style. Le site se présente comme le portail francophone des livres et des idées. Il publie des critiques de livres, mais aussi sur certains sites Web. Il est animé par une équipe d’environ 300 personnes.
Il ne s’agit donc pas d’un site typique du Web 2.0, dans le sens où il y a une rédaction définie. Il offre tout de même aux lecteurs la possibilité d’écrire des commentaires sur les différents articles.


Photo: ulle.b (Flickr.com)

http://www.nonfiction.fr