mercredi, août 30, 2006

Technorati, champion de l'holophrastique ! (29.10.2005)

Le succès de Technorati est une nouvelle illustration d’une des idées fortes de Yochai Benkler qui, dans l’article « Coase’s Penguin » (dont je ne peux cesser d’encourager la lecture : http://www.benkler.org/CoasesPenguin.html), voyait dans le fonctionnement de la communauté Open Source qui avait donné naissance à Linux rien moins qu’un troisième modèle de « production » après celui de la firme et celui du marché, tous deux bien connus des économistes. Son analyse part du constat que sur le Web, le « bien » produit est le même que le bien consommé, l’information ; dont les coûts de production (individuelle ou institutionnelle) et les coûts d’échange ont été massivement réduits à l’ère du Web ; et dont la composante humaine, le talent créatif, est hautement variable et inégalement réparti. Dans ce contexte spécifique, nous dit Benkler, la « production collective » (ou peer production) permet des gains d’information et une optimisation de la répartition de cette information qui dépassent, pour peu qu’un grand nombre d’agents puissent librement échanger à bas coût une information riche, les coûts supplémentaires engendrés par l’absence de contrats (la firme) ou de propriété (le marché). Ainsi dans la communauté du développement Linux, observe-t-il, le gain représenté par la disponibilité généralisée d’un système d’exploitation utilisable par tous pour des applications les plus variées, l’emporte largement sur les dépenses, prises individuellement, consenties (temps, efforts, code source produit, infrastructure d’accréditation et de validation) par chacun des développeurs. (Le modèle n’est pas sans ses problèmes non plus, comme, d’ailleurs dans les cas de la firme et du marché ; nous y reviendrons plus loin.)


Wikipedia fonctionne suivant le même modèle. L’encyclopédie collective est le résultat de contributions individuelles d’un très grand nombre d’agents, motivés à fournir, corriger ou valider de l’information pour des raisons plutôt socio-psychologiques (la « réputation », incitative à produire une information de qualité reconnue par ses pairs, comme dans les milieux académiques de la recherche, par exemple) que financières. Le coût total de ces perso-contributions est finalement trivial comparé aux gains que représente l’accessibilité pour tout un chacun d’une telle richesse de connaissances. Ici encore, on constate que les clés permettant au dispositif de fonctionner sont bien la variabilité du talent à produire le bien considéré, ici de l’information ou plus précisément des entrées dans l’encyclopédie, le grand nombre de producteurs et de relecteurs, combiné au faible coût de cette production, de cette relecture et des échanges qu’ils provoquent.


L’idée géniale de David Sifry, le fondateur de Technorati, a été de considérer l’acte de poster un billet sur un blog exactement comme une de ces perso-contributions à l’élaboration d’un « holos », d’un « tout » collectif dont la valeur est bien supérieure à la dépense demandée à chacun des blogueurs. Et quel est ce tout collectif si précieux ? Sifry l’appelle « the global conversation », la conversation généralisée qui à tout instant anime la toile, sur tous les sujets, du plus anodin au plus dramatique : une illumination, à la lecture du livre « The Cluetrain Manifesto » (http://www.cluetrain.com/) de Christopher Locke, Rick Levine, Doc Searles et David Weinberger – ce dernier, par ailleurs, auteur du non moins excellent « Small Pieces Loosely Joined », dont la lecture pendant ce week-end prolongé de Toussaint qui s’annonce est, dois-je le préciser, in-dis-pen-sa-ble.


Pour participer à la conversation généralisée, une fois l’enregistrement terminé sur le site Technorati, le blogueur installe un simple script dans son blog qui notifie Technorati de chaque nouveau texte publié. (Depuis peu, on peut même y ajouter ses propres tags qui sont également pris en compte par Technorati.) Les services de Technorati indexent alors automatiquement le nouveau billet pratiquement au moment même de sa publication, et intègrent les tags correspondants à une « folksonomy » en perpétuelle évolution. En retour – le « give back », mot d’ordre de la communauté du logiciel libre –, Technorati offre au public un moteur de recherche dans les blogs se basant sur cet index et donc capable de montrer en temps quasi-réel ce que le Web dit, au travers des blogs, ici et maintenant de l’objet de la recherche.


Contrastant vivement avec les moteurs de recherche traditionnels comme Yahoo! et Google dont les robots collectent périodiquement les pages Web pour les indexer (c’est encore comme ça que fonctionne le moteur de recherche dans les blogs de Google, blogsearch.google.com, dont l’accueil fut plutôt mitigé), ce sont les sources d’information elles-mêmes qui signalent à Technorati leur existence et leur contenu. Ainsi les résultats d’une recherche n’évoluent plus au rythme (ralentissant avec le nombre) des passages des chaluts de Google et de Yahoo!, mais bien à celui, instantané, de la création même de l’information. Hier soir, Technorati suivait 20,2 millions de sites et offrait 1,6 milliards de liens et pointeurs…


Technorati offre ensuite de nombreux services mettant en avant (ou rendus possibles par) cette instantanéité. Des « watch lists » peuvent ainsi être établies sur le site pour surveiller en permanence ce qui se dit sur tel ou tel sujet. L’indexation concomitante à la publication permet également d’établir des classements des sujets, des sites, des tags, des livres, des actualités, des films les plus populaires, le « top 50 » de tout ce qui est publié, par catégorie. (Combien donneraient ainsi tout pour se retrouver dans le Technorati Top 100, actualisé en temps réel ! Le système de réputation dans toute sa splendeur) Bref, Technorati, spectaculaire et spéculaire, renvoie l’image globale des millions de conversations qui défilent sur la toile, gardien des communications éphémères entre des auteurs qui lisent et des lecteurs qui écrivent.


Tantek Celik, le CTO de Technorati, est allé plus loin encore, en proposant une architecture technique pour la collecte de ces perso-contributions dans le cadre le plus général. Chef de file de l’équipe technique d’Open Doc chez Apple Computer au début des années 90 (rien ne se perd, rien ne se crée : le Mac a tout inventé !), et après être passé chez Microsoft, Tantek Celik, spécialiste de XHTML, a rejoint Technorati en 2004 et a lancé l’initiative « microformats » (cf. http://microformats.org/). Les microformats sont un jeu de standards ouverts et simples permettant d’annoter le contenu que l’on publie sur le Web de données supplémentaires. Souvent opposé au Web Sémantique (avec majuscules), les standards sur lesquels travaille le W3C, les microformats se réclament d’un web sémantique (en minuscules), et ont été conçus pour coller à la réalité des usages qui sont faits de l’information dans les blogs et les wikis. Il existe des microformats pour les gens et les organisations (hCard), les événements (hCalendar), les opinions et les scores (VoteLink, hReview), les réseaux sociaux (XFN), les licences et les droits d’utilisation (relLicense), les tags et les catégories (relTag), les listes et les plans (XOXO), les adresses (adr), la géolocalisation (geo), etc. Par exemple, en ajoutant « rel="license" » à un lien hypertexte, on indique tout simplement que la page pointée par le lien est la licence d’utilisation régissant la page de départ ; en ajoutant « rel="tag" » à un lien hypertexte, on indique qu’un fragment d’une page Web est annoté par le tag vers lequel ce lien pointe.


Un des objectifs de ce groupe animé par Celik et quelques autres est d’affiner et d’enrichir ces spécifications pour les soumettre au bout du compte à un organisme de standardisation comme le W3C et IETF et à promouvoir leur adoption dans les outils de publication et de collecte de meta-données dans les efforts collectifs de production d’information.


Car, pour revenir à notre inspirateur Benkler, la production collective présente également son lot spécifique de problèmes éventuels. Quel mécanisme de qualification des perso-contributions et de maintien de l’intégrité du contenu collectivement édité faut-il mettre en place ? Quel mécanisme d’intégration de ces perso-contributions fonctionne-t-il ? (C’est d’ailleurs le point sur lequel porte le débat entre le camp des taggers et celui des partisans des taxonomies hiérarchiques, plus rigides.) Des obstacles peuvent rendre difficile cette intégration elle-même, si, par exemple, elle requiert des ressources réglementées pour être réalisée : c’est le cas aujourd’hui si l’on aborde d’autre types de media que le texte, comme la musique ou la vidéo dont les droits sont âprement défendus par les associations professionnelles de producteurs. Mais d’autres obstacles existent qui menacent la motivation à participer à l’effort collectif : l’appropriation de l’information par certains, par exemple, peut-être ressentie par d’autres comme un frein à leur envie de contribuer ; ou encore les difficultés et les échecs d’intégration peuvent être diversement ressentis par les contributeurs (que l’on se réfère à la dramaturgie des « forks » dans le développement des logiciels libres, par exemple), etc.


Nous n’en sommes donc qu’au début d’une éventuelle généralisation des principes socio-économiques dont le logiciel libre fut naguère le révélateur – et qui sont encore sujets à discussion dans de nombreux cercles. Le développement ultra-rapide, l’hyperdéveloppement pourrait-on dire, de nouveaux services Web comme Technorati, mais aussi de ses concurrents et imitateurs, DayPop, IceRocket, Bloglines, etc., ou bien encore des Wikipedia, Flickr, Revver, Odeo, et d’outils comme Flock, le tout nouveau sujet d’excitation des technophiles, Wikimedia, WordPress, SocialText et tant d’autres, montrent que ces mêmes principes peuvent prendre racine ailleurs que dans la communauté Open Source et donner naissance à d’autres formes de collaboration sur le Web, voire, selon certains, à influer même sur son développement à venir.

ShareThis