vendredi, septembre 01, 2006

La spécialisation des moteurs de recherche
Lundi 02 janvier 2006

Dans le droit esprit de l'importance médiatique prise en 2005 par les tags et leurs prosélytes, le nouveau site de recherche Wink vient de s'ouvrir au public dans un grand éclat de commentaires dans la blogosphère. Wink est un moteur de recherche dans les sites de "social bookmarking" comme del.icio.us (maintenant Yahoo), Yahoo! MyWeb, digg, furl, etc. Présentant une interface à la Google, Wink indexe et recherche dans les bookmarks partagés et met ses résultats en regard de ceux d'une recherche des mêmes termes sur le Web. Un second service, "Wink Answers", offre à ses utilisateurs les réponses postées par d'autres utilisateurs à des questions libres (C'est un service comparable à Yahoo! Answers et à Google Answers). Wink Answers utilise aussi Wikipedia par défaut pour apporter une réponse minimale sur un sujet donné et susciter les réponses d'autres internautes.


Wink permet également, une fois un compte créé, de marquer ses propres pages butinées sur la Toile en leur associant les inévitables tags. Un dispositif original permet d'ailleurs de synchroniser ces marque-pages avec ceux de del.icio.us ou de Yahoo! MyWeb si l'utilisateur Wink possède également un compte personnel sur ces sites. Les marque-pages viennent alors enrichir l'index de Wink.


Après les moteurs de recherche dans les blogs, rapidement apparus quand l'indéniabilité du succès des blogs fut acquise avec le rachat de Pyra par Google, puis l'ouverture par le géant du Web de son propre moteur de recherche spécialisé dans les blogs à l'image des startups qui l'avaient précédé, Wink fait partie de ce nouveau croisement d'idées abondamment médiatisé sous le terme Web 2.0. Comme Technorati, Wink propose des services qui exploitent une information d'une nouvelle nature : celle résultant de l'agrégation de petits fragments de méta-données, d'annotations laissées par un grand nombre d'utilisateurs sur le contenu principal (actuellement) du Web. Confortant l'idée originellement exprimée par John Battelle que la recherche devient une application, à partir du moment où l'on prend en compte le comportement des utilisateurs, ce même auteur résume "Wink = search + tags + people".

De fait, le site Wink met systématiquement en avant, tant dans Wink Search que dans Wink Answers, le rôle joué par l'utilisateur et ses annotations personnelles dans la qualité des résultats obtenus. Suivant en cela l'argument aujourd'hui glorifié mais mis à toutes les sauces sous le sobriquet de "The Long Tail" - même les venture capitalists de la Silicon Valley commencent à s'en plaindre -, un tel système ne tient debout que :
(i) si un grand nombre de participants est rassemblé et y trouve son intérêt, ici les résultats de la recherche ;
(ii) si le geste même fondateur de la participation, ici l'annotation, n'est pas individuellement coûteux.

Ces constatations avaient été déjà faites, en leur temps, par quelques économistes qui s'étaient intéressés au mouvement Open Source et partent de la même tentative de rationalisation économique des entreprises de collaboration massive, comme celles que permet aujourd'hui à moindre coût la généralisation du Web et la démocratisation des outils de lecture et de publication sur Internet. Il reste à inventer toute une typologie de ces sites et de ces services invitant leurs consommateurs à un rôle volontairement actif, des plus immédiats comme Wink, Technorati, del.icio.us, Simpy, Signal Social (lancé en France, réjouissons-nous en, par Alain Lefebvre, co-fondateur de la SSII SQLi) aux plus ouverts comme les wikis de Wikimedia, en passant par les plus ou moins strictement modérés comme Slashdot et Kuro5hin (Wikipedia a récemment été amené a reformuler sa politique à la suite de malversations que la totale liberté éditoriale de son site permettait).


La seconde idée que la prolifération annoncée de moteurs de recherche spécialisés ou verticaux tend à accréditer est chère à mon coeur car elle me replonge directement vers mes thèmes de jeunesse, ceux de l'Intelligence Artificielle, la fameuse I.A. qui brillait au début des années 80 du même éclat que le Web 2.0 aujourd'hui. Et plus précisément vers l'idée fondatrice de toute une école de pensée développées à l'université de Carnegie-Mellon à Pittsburg dans la mouvance d'Allen Newell et de Herbert Simon ("Sciences Of The Artificial, par Herbert A. Simon, lecture in-dis-pen-sa-ble), l'I.A. dite "symbolique", qui modélise la résolution de problèmes comme une recherche dans un espace spécifique d'états et d'opérateurs.

Dans "Human Problem Solving" (publié en 1972 !), les deux auteurs, parmi les pères fondateurs des Sciences cognitives, expliquaient la faculté de l'humain à résoudre les problèmes par la mise en oeuvre de processus d'exploration et de recherche dans un espace de buts et d'objectifs, parfois intermédiaires, parfois finaux, spécifiques au domaine sous-jacent au problème en question.

Ces principes ont donné naissance à toute une famille d'algorithmes de résolution de problèmes dans des domaines les plus variés culminant dans l'architecture SOAR ("Unified Theories Of Cognition", par Allen Newell, autre lecture indispensable). Même sans approfondir ici le modèle de Newell et Simon, on se rend compte aujourd'hui que, de plus en plus, c'est dans l'usage qui est fait des moteurs de recherche que se trouve leur vraie valeur et qu'il faudra prendre en compte le domaine et les objectifs des utilisateurs avec de plus en plus de finesse.

Aujourd'hui, les services comme Wink et Yahoo MyWeb sont encore, de ce point de vue, au niveau de maillage le plus grossier : pas de catégorisation du domaine (ou peu : page Web, blog, wiki, fil RSS en constituent les unités), ni des utilisateurs (ou peu : privé, partagé par mon premier cercle, ou public). Les sites de marque-pages partagés, parce qu'ils accumulent les tags par utilisateur et par unité de contenu, constituent d'emblée une maille plus fine qui se prêtera mieux à une catégorisation progressive, donc à une spécialisation des recherches auxquelles elle fournit la matière première.


Cette évolution vers des moteurs de recherche spécialisés provoque déjà des mouvements de troupes dans l'actualité. Après bien des déboires, le site montréalais de "meta-recherche" Mamma.com a finalement racheté le moteur de recherche québécois Copernic à quelques jours de l'expiration du délai de réflexion que tous deux s'étaient donnés à la fin de l'année dernière après l'annonce de l'ouverture d'une enquête de la SEC sur Mamma.com. Du coup le cours du titre Mamma.com qui périclitait depuis un an a pris un coup d'accélérateur de plus de 25 % en une journée !

À l'inverse, Google aurait dressé une muraille de Chine - interdisant l'accès à son API pourtant publique - contre Kozoru, un jeune moteur de recherche se proposant d'alimenter son propre algorithme de filtrage et de classification aux résultats d'une requête dans Google. Vociférant dans la blogosphère, Kozoru crie donc au loup, trouvant dans l'incident la preuve que ses algorithmes sont les meilleurs : toute publicité est bonne à prendre !


On le voit : de la théorie à la pratique des moteurs de recherche spécifiques, le chemin est long et la pente est raide...

ShareThis