Bible virtuelle

Etrange histoire que celle de cette version de la bible, retrouvée par hasard par un savant au fond d’une corbeille à papier du Monastère Saint-Catherine, dans le Sinaï. Considérée comme de peu de valeur, le manuscrit a été démembré et, après divers aléas, s’est retrouvé dans 4 différents endroits: la British Library , la bibliothèque nationale de Russie , la bibliothèque de l’Université de Leipzig, le Monastère St. Catherine. Internet devient donc la seule possibilité de le réunir. Les différentes bibliothécaires propriétaires de parties du manuscrit ont donc décidé de mettre sur pied un projet de numérisation. La première partie des pages, celles qui se trouvent à Leipzig, sont en ligne depuis aujourd’hui:

Codex sinaiticus

http://www.codex-sinaiticus.net/

Le battage médiatique ayant été bien orchestrée, le manuscrit était difficilement accessible ce soir.

Remonter le Times

Le célèbre quotidien anglais vient de mettre l’ensemble de ses archives numérisées en ligne, des archives qui remontent à 1875. Il est désormais possible de lire des articles tels qu’ils apparurent à des lords anglais qui les découvraient dans un journal en papier parfaitement repassé par leur valet.

La page d’entrée offre une frise chronologique permettant de trouver des événements marquants durant plus de deux siècles. Pêle-mêle, on y trouve la décapitation de la reine Marie-Antoinette, la bataille de Waterloo, l’assassinat du Président Lincoln, etc. On peut accéder ensuuite à l’article dans la mise en page de l’époque, avec un repère indiquant où se trouve l’article sur la place. La rédaction a également préparé quelques dossiers thématiques, comme l’histoire de la famille royale, le Titanic ou encore Jack l’Eventreur.

Times online Archives

http://archive.timesonline.co.uk/tol/archive/

Pour l’instant, ces archives sont gratuites. Quelques articles sont en accès totalement libre et pour les autres, il suffit d’ouvrir un compte gratuit. Espérons que cela reste ainsi.

La Bibliothèque d’Alexandrie

Internet est devenu en quelques années la plus grande masse de données réunie de manière relativement homogène et accessible. Jamais jusqu’alors dans l’histoire de l’humanité, l’accès aux connaissances n’a été aussi aisé de même que leur remixage. Tous ces contenus numérisés peuvent être copiés, retravaillés, trouvés par des moteurs de recherche. La question de la conservation de ces données se pose maintenant, notamment pour les contenus numériques natifs. Cet archivage est très complexe pour plusieurs raisons:

  • les sites Internet changent très souvent
  • les formats des données évoluent sans cesse de même que les logiciels, les supports et les appareils (software, hardware)
  • les volumes nécessaires pour la conservation coûtent très chers, surtout si on souhaite un historique des données

Mais est-il nécessaire de conserver l’ensemble des données disponibles sur Internet? D’une part, tout archivage suppose un tri. Tout n’est pas digne d’archivage. Chaque société est amené à faire des choix dans ce domaine. Bien entendu, c’est risqué car même les critères de choix évoluent. Les historiens s’intéressaient d’abord aux documents officiels, mais cette discipline s’est penchée plus récemment sur la vie quotidienne des populations dont la documentation n’a pas été systématiquement archivée. Il en sera de même pour Internet: qui archivera les centaines de milliers de blogs personnels? Ils pourraient cependant constituer des témoignages intéressants pour des historiens, des sociologues, des linguistes. La lacune n’est du reste pas le pire des maux et bien des méthodes permettent d’en dessiner les traits.

Pour tempérer un peu la crainte de perdre ces données réunies en masse, essayons à nouveau de nous pencher sur le passé. L’incendie de la Bibliothèque d’Alexandrie est considéré comme une des catastrophes majeure de l’Antiquité. Pourtant ce drame doit être remis dans son contexte. Cette institution a été créée par Ptolémée 1er, premier roi grec d’Egypte à la fin du 3ème siècle avant J.-C.. Première constatation, il s’agit bien d’une volonté politique. Ensuite, cette institution ne se limitait pas à une bibliothèque: le Museion accueillait aussi des savants prestigieux qui devaient exploiter la bibliothèque. Quant à la bibliothèque elle-même, tout avait été mis en place pour l’enrichir. Les bateaux abordant dans le port d’Alexandrie devaient remettre leurs documents pour qu’ils soient copiés. La copie était rendue au capitaine et l’original conservé à la Bibliothèque.

La Bibliothèque d’Alexandrie n’était pas un cas unique: toutes les grandes cités de la période hellénistique avait la leur. Il y avait même une émulation, voire une concurrence entre toutes ces bibliothèques. On essayait par exemple d’acquérir des collections d’ouvrages ou d’attirer les meilleurs savants. La principale concurrente d’Alexandrie était Pergame. On raconte que les Alexandrins avaient refusé d’exporter du papyrus égyptien vers Pergame pour mettre à mal les activités de sa bibliothèque. Les gens de Pergame ont donc essayé de trouvé un autre support pour écrire et ont donc inventé le parchemin, fabriqué à partir de peau de bête. Le mot parchemin vient du nom de Pergame et ce support s’imposera au Moyen Âge.

Que constate-t-on durant la période hellénistique? Une circulation et une diffusion importante des connaissances doublée d’une grande activité intellectuelle. Grâce à toutes ces bibliothèques, on a pu faire une synthèse de la culture grecque (en incluant même des cultures voisines). On a revisité les auteurs anciens. Aucune de ces bibliothèques n’a survécu au temps, ni celle d’Alexandrie, ni celle de Pergame. Peu importe donc que César lui ait bouté le feu. L’essentiel est en fait que ces bibliothèques ont existé, que les connaissances et les idées ont circulé. Grâce à cela, nous avons pu conserver des connaissances qui auraient été perdues autrement. Bien entendu, on peut regretter que les savants hellénistiques aient fait des sélections comme les pièces des Tragiques qui méritaient de passer à la postérité. Sans eux cependant, on aurait peut-être perdu l’ensemble de ces oeuvres.

Bibliothèque privée

Bibliothèque romaine privée
Crédit : http://www.vroma.org/

N’assiste-t-on pas à un phénomène analogue aujourd’hui? De plus en plus de connaissances sont maintenant accessibles et les efforts de numérisation continuent. En même temps, ces connaissances font l’objet de discussions, de commentaires, de synthèses, de recompositions, d’indexation. Ce qui nous distingue de l’époque hellénistique, c’est le nombre de personnes qui ont accès à ces connaissances, parce qu’elles savent lire et qu’elles ont un appareil leur permettant d’y accéder à disposition. Il y a là un formidable catalyseur de découvertes, de progrès scientifiques, ce d’autant plus que les outils que nous avons à disposition facilitent la collaboration et le partage. C’est ce phénomène qui mérite d’être reconnu aux yeux des générations futures.

Nous avons regardé dans le passé. Plongeons-nous dans le futur maintenant, mais dans celui de la science-fiction. Dans son cycle Fondation, Isaac Asimov pose une question intéressante. Son personnage, Hari Seldon, montre que les civilisations connaissent des cycles de mort et de renaissance. Grâce à une science qu’il a développé, la psychohistoire, il parvient à calculer l’intervalle entre la mort prochaine de sa propre civilisation et celle qui lui succédera. Comme cet intervalle est long (30’000 ans), il se demande comment le réduire. C’est ainsi qu’il crée aux confins du monde deux fondations formées de savants qui ont pour tâche de rédiger l’Encyclopedia Galactica. Cela n’est pas sans rappeler le rôle des Monastères du Moyen-Âge qui ont thésaurisé des connaissances de l’Antiquité pour le plus grand bénéfice de notre culture.

Pour revenir à la question de l’archivage, on voit bien que l’exhaustivité n’est pas requise. Un processus de sélection doit intervenir, qu’il se fasse par un choix conscient ou sui generis (ou une solution hybride). Nous n’en sommes peut-être pas encore là. Pour l’instant, il s’agit de tout mettre sur la table, de faire l’inventaire de nos connaissances, de rediscuter peut-être les critères qui nous permettent de qualifier ces connaissances.

Virtuelle conférence

En ce moment même, sur Second Life, se tient une conférence intitulé “ The Virtual Worlds: Libraries, Education and Museums Conference“. Les intervenants y présentent, grâce à leurs avatars, des conférences portant justement sur l’utilisation des mondes virtuels dans les domaines de l’éducation et de la culture.

Virtual Conference

Pour y assister, rien de plus simple: rester chez soi, allumer son ordinateur et participer.

La liste des intervetions se trouve à l’adresse suivante:

http://www.alliancelibraries.info/virtualworlds/vwlemschedule.htm

La conférence continue encore tard cette nuit. L’un des inconvénients de Second Life est son horaire, le plus souvent fixé à l’heure californienne. Cela conduit à se coucher tard …

La campagne d’Egypte

Lors de sa campagne militaire en Egypte, Bonaparte avait emmené avec lui des savants. Le résultat de leurs observation a été réuni dans un ouvrage intitulé “La Description de l’Egypte” qui a fait date et qui reste aujourd’hui encore une source d’information importante pour la connaissance de l’Egypte ancienne. Les planches notamment constituent un témoignage important sur les monuments égyptiens antiques.
Cet ouvrage, qui comporte 20 volumes, est désormais disponible sous une forme numérique sur Internet. Le site Web a été créé, sous l’égide de la Bibliotheca Alexandrina (BA) et de l’International School of Information Science (ISIS), qui est l’institut de recherche de la nouvelle Bibliothèque d’Alexandrie.

L’interface Flash conçue pour la lecture de l’ouvrage est très simple à utiliser. Elle offre la possibilité de parcourir les différentes pages de texte ou de planches ou d’effectuer des recherches dans l’ensemble, grâce à un index de mots-clés ou à un outil de recherche libre. Une fois la page trouvée, il est possible de l’agrandir, de la tourner de 90 degrés, de la sauver sur son ordinateur (eh oui :-)), d’en garder le lien dans le navigateur ou de l’envoyer à un ami.
Voilà désormais un ouvrage fondamental du patrimoine disponible facilement sous une forme attractive. Et pour ceux qui n’auraient pas une liaison à large bande, un DVD est disponible.

http://descegy.bibalex.org/

Bibliotheca Alexandrina

ISIS

La vie de Stendhal numérisée

Stendhal, de son vrai nom Henri Beyle, a laissé un texte autobiographique sous le titre de “La vie d’Henri Brulard”. La bibliothèque municipale de Grenoble présente le manuscrit numérisée de cette oeuvre sous une forme particulièrement attractive. En effet, il est possible de le feuilleter en ligne.

Il s’agit d’une application Flash, pourvue d’une animation grâce à laquelle on voit les pages se tournent. Petit raffinement: en entend même le bruit du papier. Une fois une page atteinte, on peut l’aggrandir pour mieux lire l’écriture serrée de l’auteur de la Chartreuse de Parmes.

L’édition diplomatique, aussi disponible en ligne, met côte à côte la transcription et le manuscrit. Un outil de recherche permet enfin de rechercher des termes dans le manuscrit.

Cerise sur le gâteau, la Bibliothèque municipale de Grenoble présente aussi une petite exposition virtuelle sur Stendhal, permettant de mieux faire connaissance avec l’écrivain et les détails de sa vie.

Manuscrit:
http://www.arkhenum.fr/bm_grenoble/stendhal/

Exposition
http://www.lectura.fr/expositions/stendhal/default.html

Appel à la foule

Un des grands chantiers du Web, c’est l’indexation des contenus. Cela signifie que chaque objet d’information: page web, fichier graphique, document, doit recevoir des mots-clés. Dans une banque de données restreinte comme un catalogue de musée ou de bibliothèque, c’est déjà une entreprise délicate. Mais à l’échelle d’Internet, c’est une tâche titanesque. Pourtant la nécessité est claire, si l’on souhaite accéder à l’ensemble des ressources via un moteur de recherche. Les éléments comportant du texte peuvent être indexés et livrer ainsi quelques mots-clés (même si ce n’est pas forcément les termes par lesquels les gens les chercheront). Les images continuent à poser un problème. Les moteurs de recherche d’images fonctionnent habituellement en indexant le nom du fichier et le contenu de la page où l’image est intégrée. Les images étant par nature complexes, on n’obtient pas forcément les mots-clés adéquats. Le recours à l’intelligence humaine semble être encore le meilleur moyen. Mais comment indexer des masses d’images?
Cette question est posée depuis quelques temps sur Internet, notamment grâce à des sites de partage de photos comme Flickr. Sur ce site, celui qui met une image peut insérer des mots-clés. Les autres utilisateurs ont la possibilité de proposer des mots-clés complémentaires, si le propriétaire des images l’autorise.


Exemple d’une image “taggable” dans Flickr

La possibilité de donner des mots-clés à des objets s’appelle le tagging, du terme anglais tag.
Pourquoi cette possibilité de donner des mots-clés alternatifs? C’est essentiel, car on sait que c’est une pratique très subjective. Celui qui a créé l’image est peut-être un connaisseur du sujet: imaginons un botaniste qui prend une photo d’une fleur. Il va en donner le nom scientifique. Mais la plupart des gens utiliseront le terme vernaculaire pour rechercher une image de cette fleur. De plus, ce terme vernaculaire peut changer d’une région à l’autre. On comprend alors l’intérêt de laisser d’autres utilisateurs proposer des mots-clés. Il y a bien entendu le risque d’avoir aussi des termes erronés ou absurdes, mais le bénéfice général est supérieur. Quand on donne la possibilité au public de proposer des mots-clés, on parle de folksonomy ou indexation populaire.
Dans le domaine des musées, on s’est intéressé à la folksonomy. Il y a des expériences en cours, comme le “Art Museum Social Tagging Project” ou Steve. Le site Web du projet présente des oeuvres d’art et des objets archéologiques ou ethnologiques à indexer. Les visiteurs peuvent proposer des mots-clés. Une première analyse des termes proposés par le public montre que 90% des termes proposés ne se trouvent pas dans la documentation du musée relative à aux objets correspondants.

http://www.steve.museum/index.php?optio … &id=51

http://www.steve.museum/

Cela illustre bien le fossé entre l’indexation savante et les représentations populaires. Et cela fonde la nécessité de l’indexation populaire. Du reste, certains musées jouent déjà le jeu:

http://www.clevelandart.org
http://magart.rochester.edu/

Le recours aux foules pour indexer des masses énormes de documents correspond à deux tendances profondes et conjointes du web. Tout d’abord le Web 2.0 et la soif des internautes de participer aux contenus. Wikipédia, l’encyclopédie participative, en est l’exemple-phare. On est passé d’un internaute consommateur, content de trouver de nombreuses données en ligne, à un internaute consomm-acteur, qui souhaite contribuer aux sites qu’il visite, en commentant, en composant des textes, en intégrant des images, etc… La seconde tendance est en fait l’autre face du Web 2.0: les initiateurs de grands projets ont tôt fait de comprendre le parti qu’ils pouvaient tirer de la situation en utilisant le travail de la foule des internautes. On parle alors de “crowdsourcing”, un terme forgés sur les termes “crowd” (foule” et out-sourcing. Il y en a de nombreux exemples: cela peut aller de l’utilisation de la puissance de calcul de milliers d’ordinateurs dispersés dans le monde à de la recherche médicale. Certains projets assurent même un revenus à ceux qui y participent.
En l’absence de salaire, comment convaincre les internautes d’indexer des images? Le tagging est une activité modeste et invisible (contrairement à un article dans Wikipédia). Luis von Ahn, un chercheur en informatique, a considéré que la facteur humain était essentiel dans l’informatisation et la numérisation. Il a imaginé qu’un simple jeu pouvait permettre d’indexer une masse considérable d’images. Il a mis au point ESPgame: on joue avec un partenaire attribué par le système. Chacun voit la même image et doit proposer des mots-clés dans un temps limite pour obtenir des points.

http://www.espgame.org/

Ce jeu a obtenu un grand succès et il a été repris par Google, sous le nom de Google Image Labeler:

http://images.google.com/imagelabeler/

Ainsi, grâce à ce jeu simplissime et pourtant amusant (voire addictif comme tous les jeux à score), Google escompte bien indexer des masses à peine chiffrables d’images et améliorer ainsi les recherches de Google Images.

Alors que le monde physique est marqué par une tendance à l’individualisme, le monde virtuel retrouve l’esprit des bâtisseurs de cathédrale, de la participation à une tâche qui dépasse l’individu. Cet état d’esprit est fondamental pour augmenter les informations sur Internet et les consolider en les rendant plus accessibles. Il est évident que l’indexation est l’une des clés de cette consolidation et qu’elle ne peut pas être le fait d’individus ou d’équipes restreintes et hautement formées.

Mémoire européenne

Pour tous ceux qui s’intéressent à l’histoire de l’Europe de l’après-guerre, le site du Centre virtuel de la connaissance sur l’Europe est un passage obligé. Il réunit en effet plus de 15’000 documents, textes, articles de journaux, lettres officielles, photos, vidéos, cartes, etc…
Pour se retrouver dans cette masse de documents, on peut utiliser le moteur de recherche ou passer par le système de navigation qui donne son nom à la banque de connaissance: European NAvigator. Les documents sont rangés chronologiquement (par événements historiques), selon les institutions (Union européenne ou Conseil de l’Europe par exemple). Plusieurs dossiers spéciaux sont également disponibles, dont le plus récent concerne Willy Brandt. On peut aussi se promener dans la médiathèque et retrouver les documents selon leur type (texte, photos, vidéos, …).
Le Thesaurus permet d’accéder à des documents selon des thèmes hiérarchisés. On connaît la complexité du jargon européen. Le site offre donc un lexique définissant les termes importants.

http://www.ena.lu/

Ce site s’adresse avant tout à un public de connaisseurs: étudiants, chercheurs, enseignants. Il a un système de navigation relativement complexe. L’accès à un document implique parfois l’ouverture de plusieurs fenêtres du navigateur, ce qui est un peu pénible.

Dis-moi, Muse!

Si les anciens vénéraient les Muses parce qu’elles inspiraient les aèdes au moment où ils se mettaient à raconter les histoires des héros comme Ulysse ou Achille, nous serons peut-être redevables à Internet de maintenir les connaissances de ces récits et surtout de les rendre accessibles sous des formes attractives. Le projet Chicago Homer est sans conteste parmi ceux qui donneront envie d’approfondir les textes épiques grecs.
Le site Chicago Homer permet de lire les vers grecs en parallèle avec le texte traduit dans une langue moderne. Chaque mot grec est cliquable, ce qui permet d’afficher à droite le mot tel qu’il apparaît dans le le dictionnaire, le lemme. En cliquant sur le lemme, on peut accéder à toutes les citations de ce mot dans les textes du projet (Homère, Hymnes homériques et Hésiode). Ainsi il est possible de voyager d’un texte à l’autre, en suivant un terme ou un personnage. Cet outil invite à une lecture discursive (la lecture suivie étant certainement préférable avec un livre dans un fauteuil au coin du feu). Il permet d’accéder à l’univers d’un mot dans l’univers de l’épopée grecque. Cela a beaucoup de sens, car l’épopée grecque était elle-même très hypertextuelle. Presque chaque vers comporte des allusions à d’autres épidodes ou une citation d’autres vers.

Le site Chicago Homer est lié à la bibliothèque digitale de référence Perseus. Les textes utilisés par le projet, qu’il s’agisse des originaux grecs ou des traductions en anglais ou en allemand, sont en partie anciens (et donc dans le domaine public) et en partie récents. Fort heureusement, des arrangements avec les éditeurs commencent à se faire.
L’ergonomie du système n’est pas encore idéale. On se perd un peu dedans et il n’est pas aisé de savoir comment revenir au premier texte que l’on était en train de lire. La fenêtre réduite n’est pas non plus idéale. Les écrans sont devenus spacieux et l’utilisateur aimerait sans doute avoir plus de place à disposition. Malgré ces petits défauts, l’Homère de Chicago est à intégrer dans vos bookmarks.

http://www.library.northwestern.edu/homer/

http://www.perseus.tufts.edu/

Les ruines de Pompéi

Bricks est un projet financé par la Communauté européenne, dont le but est l’encouragement à la digitalisation. Parmi les réalisations de ce projet, on trouve une bibliothèque digitale permettant de retrouver des documents provenant d’anciennes publications sur Pompéi: “The Fortuna Visiva of Pompeii”. Pour accéder aux documents, il faut cliquer sur un plan de Pompéi. Il s’agit le plus souvent de dessins faits par des archéologues au 19ème siècle, reproduits dans leurs publications. Ces ouvrages sont très difficilement accessibles aujourd’hui et ils sont pourtant encore utiles, ne serait-ce que parce qu’ils témoignent du site dans un état de conservation différent d’aujourd’hui. En outre, ces dessins anciens représentant des monuments, des peintures, des mosaïques, sont remarquables.

http://pompeii.brickscommunity.org:8080/BricksPompei/

Tout louable que soit ce site, il n’en présente pas moins quelques faiblesses. Son ergonomie n’est pas aisée. La carte est muette: elle ne donne aucun nom de maison ou de monument. Il faut donc soit connaître Pompéi comme sa poche, soit y aller au hasard, soit encore disposer d’un autre plan, parlant celui-là. Il est possible de rechercher les documents grâce à un formulaire, mais ce dernier ne dispose d’aucune aide. En principe, il devrait offrir des menus déroulants ou des listes de mots-clés. Enfin, vu la beauté des dessins et le fait qu’ils sont clairement dans le domaine public, on peut regretter que la version agrandie soit affublée d’un grand P renversé, pour éviter que les images soient réutilisées dans d’autres contextes.

;-)Le plus cocasse, dans cette affaire, c’est qu’un des ouvrages qui est le plus souvent référencé dans le site “The Fortuna Visiva of Pompeii”, “Les ruines de Pompéi” par F. Mazois, est disponible dans la nouvelle bibliothèque numérique européenne Europeana:

http://www.europeana.eu/Search?q=Mazois … 10&p=1

On peut consulter aussi bien les pages scannées que le texte numérisé. Mais le lien avec le plan de Pompéi n’existe pas. Rien n’est parfait, même dans le monde virtuel.

Le plus difficile, dans le domaine des projets de digitalisation, c’est de donner un accès aux documents en grande masse. La carte est un excellent moyen, mais dans le cas qui nous occupe , cette carte n’a pas les fonctionnalités requises: légende, passage vers une image satellite, etc.. En outre, il faut créer des outils capables d’intégrer constamment de nouvelles couches d’informations. Un des excellents exemples est celui des applications géographiques de Google. Elles sont prévues pour permettre la connection avec d’autres sources de données. Nous avions déjà mentionné ce développement d’un ingénieur de Google, assurant le lien entre des lieux mentionnés dans un livre et la carte. Si on me demandait mon avis, je dirais que dans le cas d’un site comme Pompéi, il faudrait tout d’abord créer un plan de référence, accessible à tous et sur lequel différentes équipes de chercheurs pourraient greffer leurs propres informations.

Bricks Project: http://www.brickscommunity.org/