{"id":160,"date":"2008-01-04T14:22:00","date_gmt":"2008-01-04T14:22:00","guid":{"rendered":"https:\/\/be-virtual.ch\/blog\/2008\/01\/04\/appel-a-la-foule\/"},"modified":"2008-01-04T14:22:00","modified_gmt":"2008-01-04T14:22:00","slug":"appel-a-la-foule","status":"publish","type":"post","link":"https:\/\/be-virtual.ch\/blog\/2008\/01\/04\/appel-a-la-foule\/","title":{"rendered":"Appel \u00e0 la foule"},"content":{"rendered":"<p>Un des grands chantiers du Web, c&rsquo;est l&rsquo;indexation des contenus. Cela signifie que chaque objet d&rsquo;information: page web, fichier graphique, document, doit recevoir des mots-cl\u00e9s. Dans une banque de donn\u00e9es restreinte comme un catalogue de mus\u00e9e ou de biblioth\u00e8que, c&rsquo;est d\u00e9j\u00e0 une entreprise d\u00e9licate. Mais \u00e0 l&rsquo;\u00e9chelle d&rsquo;Internet, c&rsquo;est une t\u00e2che titanesque. Pourtant la n\u00e9cessit\u00e9 est claire, si l&rsquo;on souhaite acc\u00e9der \u00e0 l&rsquo;ensemble des ressources via un moteur de recherche. Les \u00e9l\u00e9ments comportant du texte peuvent \u00eatre index\u00e9s et livrer ainsi quelques mots-cl\u00e9s (m\u00eame si ce n&rsquo;est pas forc\u00e9ment les termes par lesquels les gens les chercheront). Les images continuent \u00e0 poser un probl\u00e8me. Les moteurs de recherche d&rsquo;images fonctionnent habituellement en indexant le nom du fichier et le contenu de la page o\u00f9 l&rsquo;image est int\u00e9gr\u00e9e. Les images \u00e9tant par nature complexes, on n&rsquo;obtient pas forc\u00e9ment les mots-cl\u00e9s ad\u00e9quats. Le recours \u00e0 l&rsquo;intelligence humaine semble \u00eatre encore le meilleur moyen. Mais comment indexer des masses d&rsquo;images?<br \/>Cette question est pos\u00e9e depuis quelques temps sur Internet, notamment gr\u00e2ce \u00e0 des sites de partage de photos comme Flickr. Sur ce site, celui qui met une image peut ins\u00e9rer des mots-cl\u00e9s. Les autres utilisateurs ont la possibilit\u00e9 de proposer des mots-cl\u00e9s compl\u00e9mentaires, si le propri\u00e9taire des images l&rsquo;autorise.<\/p>\n<p><a href=\"http:\/\/bp0.blogger.com\/_0O46EBN2sig\/R6eP9bn-r8I\/AAAAAAAAAEY\/_BEXfUs1Hps\/s1600-h\/tag-flickr.jpg\"><img decoding=\"async\" style=\"cursor: pointer;\" src=\"http:\/\/bp0.blogger.com\/_0O46EBN2sig\/R6eP9bn-r8I\/AAAAAAAAAEY\/_BEXfUs1Hps\/s400\/tag-flickr.jpg\" alt=\"\" id=\"BLOGGER_PHOTO_ID_5163253783353798594\" border=\"0\" \/><\/a><br \/>Exemple d&rsquo;une image \u00ab\u00a0taggable\u00a0\u00bb dans <a href=\"http:\/\/flickr.com\/photos\/revilla\/425422591\/\" target=\"_blank\" rel=\"noopener noreferrer\">Flickr<\/a><\/p>\n<p>La possibilit\u00e9 de donner des mots-cl\u00e9s \u00e0 des objets s&rsquo;appelle le <b>tagging<\/b>, du terme anglais tag.<br \/>Pourquoi cette possibilit\u00e9 de donner des mots-cl\u00e9s alternatifs? C&rsquo;est essentiel, car on sait que c&rsquo;est une pratique tr\u00e8s subjective. Celui qui a cr\u00e9\u00e9 l&rsquo;image est peut-\u00eatre un connaisseur du sujet: imaginons un botaniste qui prend une photo d&rsquo;une fleur. Il va en donner le nom scientifique. Mais la plupart des gens utiliseront le terme vernaculaire pour rechercher une image de cette fleur. De plus, ce terme vernaculaire peut changer d&rsquo;une r\u00e9gion \u00e0 l&rsquo;autre. On comprend alors l&rsquo;int\u00e9r\u00eat de laisser d&rsquo;autres utilisateurs proposer des mots-cl\u00e9s. Il y a bien entendu le risque d&rsquo;avoir aussi des termes erron\u00e9s ou absurdes, mais le b\u00e9n\u00e9fice g\u00e9n\u00e9ral est sup\u00e9rieur. Quand on donne la possibilit\u00e9 au public de proposer des mots-cl\u00e9s, on parle de <b>folksonomy<\/b> ou <b>indexation populaire<\/b>.<br \/>Dans le domaine des mus\u00e9es, on s&rsquo;est int\u00e9ress\u00e9 \u00e0 la folksonomy. Il y a des exp\u00e9riences en cours, comme le \u00ab\u00a0Art Museum Social Tagging Project\u00a0\u00bb ou Steve. Le site Web du projet pr\u00e9sente des oeuvres d&rsquo;art et des objets arch\u00e9ologiques ou ethnologiques \u00e0 indexer. Les visiteurs peuvent proposer des mots-cl\u00e9s. Une premi\u00e8re analyse des termes propos\u00e9s par le public montre que <b>90% des termes propos\u00e9s ne se trouvent pas dans la documentation du mus\u00e9e<\/b> relative \u00e0 aux objets correspondants.<\/p>\n<p><a href=\"http:\/\/bp1.blogger.com\/_0O46EBN2sig\/R6eQDrn-r9I\/AAAAAAAAAEg\/gpkUMCEQ8TY\/s1600-h\/steve.jpg\"><img decoding=\"async\" style=\"cursor: pointer;\" src=\"http:\/\/bp1.blogger.com\/_0O46EBN2sig\/R6eQDrn-r9I\/AAAAAAAAAEg\/gpkUMCEQ8TY\/s400\/steve.jpg\" alt=\"\" id=\"BLOGGER_PHOTO_ID_5163253890727981010\" border=\"0\" \/><\/a><\/p>\n<p><a href=\"http:\/\/www.steve.museum\/index.php?option=com_weblinks&amp;task=view&amp;catid=35&amp;id=51\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.steve.museum\/index.php?optio &#8230; &amp;id=51<\/a><\/p>\n<p><a href=\"http:\/\/www.steve.museum\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.steve.museum\/<\/a><\/p>\n<p>Cela illustre bien le foss\u00e9 entre l&rsquo;indexation savante et les repr\u00e9sentations populaires. Et cela fonde la n\u00e9cessit\u00e9 de l&rsquo;indexation populaire. Du reste, certains mus\u00e9es jouent d\u00e9j\u00e0 le jeu:<\/p>\n<p>&#8211; <a href=\"http:\/\/www.clevelandart.org\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.clevelandart.org<\/a><br \/>&#8211; <a href=\"http:\/\/magart.rochester.edu\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/magart.rochester.edu\/<\/a><\/p>\n<p>Le recours aux foules pour indexer des masses \u00e9normes de documents correspond \u00e0 deux tendances profondes et conjointes du web. Tout d&rsquo;abord le Web 2.0 et la soif des internautes de participer aux contenus. Wikip\u00e9dia, l&rsquo;encyclop\u00e9die participative, en est l&rsquo;exemple-phare. On est pass\u00e9 d&rsquo;un internaute consommateur, content de trouver de nombreuses donn\u00e9es en ligne, \u00e0 un internaute consomm-acteur, qui souhaite contribuer aux sites qu&rsquo;il visite, en commentant, en composant des textes, en int\u00e9grant des images, etc&#8230; La seconde tendance est en fait l&rsquo;autre face du Web 2.0: les initiateurs de grands projets ont t\u00f4t fait de comprendre le parti qu&rsquo;ils pouvaient tirer de la situation en utilisant le travail de la foule des internautes. On parle alors de \u00ab\u00a0crowdsourcing\u00a0\u00bb, un terme forg\u00e9s sur les termes \u00ab\u00a0crowd\u00a0\u00bb (foule\u00a0\u00bb et out-sourcing. Il y en a de nombreux exemples: cela peut aller de l&rsquo;utilisation de la puissance de calcul de milliers d&rsquo;ordinateurs dispers\u00e9s dans le monde \u00e0 de la recherche m\u00e9dicale. Certains projets assurent m\u00eame un revenus \u00e0 ceux qui y participent.<br \/>En l&rsquo;absence de salaire, comment convaincre les internautes d&rsquo;indexer des images? Le tagging est une activit\u00e9 modeste et invisible (contrairement \u00e0 un article dans Wikip\u00e9dia). Luis von Ahn, un chercheur en informatique, a consid\u00e9r\u00e9 que la facteur humain \u00e9tait essentiel dans l&rsquo;informatisation et la num\u00e9risation. Il a imagin\u00e9 qu&rsquo;un simple jeu pouvait permettre d&rsquo;indexer une masse consid\u00e9rable d&rsquo;images. Il a mis au point ESPgame: on joue avec un partenaire attribu\u00e9 par le syst\u00e8me. Chacun voit la m\u00eame image et doit proposer des mots-cl\u00e9s dans un temps limite pour obtenir des points.<\/p>\n<p><a href=\"http:\/\/www.espgame.org\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/www.espgame.org\/<\/a><\/p>\n<p>Ce jeu a obtenu un grand succ\u00e8s et il a \u00e9t\u00e9 repris par Google, sous le nom de Google Image Labeler:<\/p>\n<p><a href=\"http:\/\/images.google.com\/imagelabeler\/\" target=\"_blank\" rel=\"noopener noreferrer\">http:\/\/images.google.com\/imagelabeler\/<\/a><\/p>\n<p><a href=\"http:\/\/bp1.blogger.com\/_0O46EBN2sig\/R6eQOrn-r-I\/AAAAAAAAAEo\/UpI8PEALvSs\/s1600-h\/labeler.jpg\"><img decoding=\"async\" style=\"cursor: pointer;\" src=\"http:\/\/bp1.blogger.com\/_0O46EBN2sig\/R6eQOrn-r-I\/AAAAAAAAAEo\/UpI8PEALvSs\/s400\/labeler.jpg\" alt=\"\" id=\"BLOGGER_PHOTO_ID_5163254079706542050\" border=\"0\" \/><\/a><\/p>\n<p>Ainsi, gr\u00e2ce \u00e0 ce jeu simplissime et pourtant amusant (voire addictif comme tous les jeux \u00e0 score), Google escompte bien indexer des masses \u00e0 peine chiffrables d&rsquo;images et am\u00e9liorer ainsi les recherches de Google Images.<\/p>\n<p>Alors que le monde physique est marqu\u00e9 par une tendance \u00e0 l&rsquo;individualisme, le monde virtuel retrouve l&rsquo;esprit des b\u00e2tisseurs de cath\u00e9drale, de la participation \u00e0 une t\u00e2che qui d\u00e9passe l&rsquo;individu. Cet \u00e9tat d&rsquo;esprit est fondamental pour augmenter les informations sur Internet et les consolider en les rendant plus accessibles. Il est \u00e9vident que l&rsquo;indexation est l&rsquo;une des cl\u00e9s de cette consolidation et qu&rsquo;elle ne peut pas \u00eatre le fait d&rsquo;individus ou d&rsquo;\u00e9quipes restreintes et hautement form\u00e9es.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un des grands chantiers du Web, c&rsquo;est l&rsquo;indexation des contenus. Cela signifie que chaque objet d&rsquo;information: page web, fichier graphique, document, doit recevoir des mots-cl\u00e9s. Dans une banque de donn\u00e9es restreinte comme un catalogue de mus\u00e9e ou de biblioth\u00e8que, c&rsquo;est d\u00e9j\u00e0 une entreprise d\u00e9licate. Mais \u00e0 l&rsquo;\u00e9chelle d&rsquo;Internet, c&rsquo;est une t\u00e2che titanesque. Pourtant la n\u00e9cessit\u00e9 [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[2,17,26,11,7],"tags":[],"_links":{"self":[{"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/posts\/160"}],"collection":[{"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/comments?post=160"}],"version-history":[{"count":0,"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/posts\/160\/revisions"}],"wp:attachment":[{"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/media?parent=160"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/categories?post=160"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/be-virtual.ch\/blog\/wp-json\/wp\/v2\/tags?post=160"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}