mercredi, janvier 06, 2010

La Haute Autorité de l'Algorithme


L'année 2010 s'ouvre donc sur des mouvements stratégiques des Titans du Web certainement annonciateurs de l'évolution de l'Internet dans la nouvelle décennie. Avec le (peu de) recul sur celle qui vient à peine de s'écouler, une des tendances notable des années 2000-2009 restera certainement l'affirmation progressive de ce que Clay Shirky appelle l'autorité de l'algorithme sur le Web. Google, et son célèbre algorithme de recherche — en fait, une collection de programmes informatiques de collecte et de classification de données en perpétuelle évolution — en constituent l'exemple qui vient immédiatement à l'esprit. Mais il en est de même de la confiance croissante que leurs utilisateurs accordent à Wikipedia, à Twitter pour la diffusion d'information en temps quasi-réel — qu'on se souvienne des protestations après l'élection présidentielles iranienne relayées et amplifiées par l'instantanéité des flux Twitter —, à Facebook pour les échanges (plus ou moins) privés sur le Web — autorité algorithmique d'ailleurs souvent contestée et aujourd'hui soumise à des critiques de plus en plus vives, semble-t-il —, ainsi qu'à un nombre croissant de sites d'e-commerce, de sites sociaux, d'agrégateurs de flux et de moteurs de recherche spécialisés.



La décision d'accorder sa confiance à un algorithme non supervisé de collecte et d'analyse d'un grand nombre de sources de données volumineuses, comme PageRank de Google et les recommandations d'Amazon ou de Netflix par exemple, procède insensiblement par étapes. D'abord l'algorithme produit des bons résultats ce qui emporte la première semi-conviction des utilisateurs. (Ce simple constat du succès mesurable de l'agrégation raisonnée de très nombreuses sources elles-mêmes non certifiées a revivifié tout un courant de recherche mathématiques fort intéressant sur la statistique des graphes et sur la combinatoire de leurs évolutions : à ceux qui ont le coeur bien accroché on ne saurait trop recommander la lecture de l'abordable Ensemble-Based Systems for Decision-Making et de l'ineffable The Structure and Dynamics of Networks). Ensuite le « réseau social » fonctionne à plein lorsque l'utilisateur à demi-convaincu prend conscience que d'autres autour de lui accordent déjà plus ou moins confiance à ces mêmes résultats et donc à la marque. De bons les résultats deviennent progressivement « probables », « crédibles » puis « vrais » ou perçus comme tels par un groupe croissant d'utilisateurs.



Au plan du pourvoyeur de ces algorithmes de concentration et de diffusion de l'autorité, la justification économique est à trouver dans les quelques business models du Web que cette même décennie écoulée à décanté à grand frais après l'explosion inaugurale de la « Bulle Internet » sur laquelle elle s'était superbement ouverte. La vente en ligne des sites de commerce électronique et les revenus publicitaires en sont les mécanismes élémentaires.



Tout ceci ne serait d'ailleurs qu'un évident mercantilisme — ennuyeux mais inévitable — si ce n'était les quelques accrocs à la toge blanche de la vertu dont se parent parfois ces édificateurs d'autorités algorithmiques : « PageRank est un champion de la démocratie : il profite des innombrables liens du Web pour évaluer le contenu des pages Web — et leur pertinence vis-à-vis des requêtes exprimées », est-il ainsi revendiqué sur l'improbable page « Pourquoi Google ? ». (Fascinante question et non moins fascinante assertion !) L'algorithme autoritaire n'est pas loin...



Le renforcement de l'algorithme est donc le souci stratégique constant de ces « Hautes Autorités de Confiance du Web ». Ainsi va l'incroyable travail de Microsoft sur son propre moteur de recherches, réincarné l'année passée sous la marque Bing et qui alimente maintenant directement Yahoo! — concurrent direct de Google et jusque-là de Microsoft dans le domaine des moteurs de recherches — après la tentative échouée de rachat lancée par Redmond en 2008. On ne compte plus les acquisitions de technologies innovantes et les partenariats qui, depuis quelques années, viennent nourrir et faire croître la pertinence et l'étendue de Bing : dernier exemple en date, un accord avec Twitter, autre vedette montante de la confiance déléguée à l'algorithmique en ligne. Et il suffit simplement d'évoquer le complexe jeu de chaises musicales qui a vu en quelques années Microsoft acheter le réseau publicitaire aQuantive (mai 2007, 6 Mds de dollars) et en revendre l'agence RazorFish au groupe Publicis (août 2009, 530M de dollars), pour imaginer l'enjeu du puzzle planétaire du contrôle des réseaux publicitaires en ligne.



Du côté de Google, le renforcement passe en premier lieu par l'augmentation forcenée des sources de données et d'information. Tout doit y passer : blogs, images, vidéos (YouTube), livres (Google Book Search et son programme de numérisation qui agite tellement nos édiles de l'hexagonale exception culturelle mais met aussi en émoi tout le monde de l'édition), données médicales (Google Health lancé en mai 2008) — qui, curieusement, n'attire (encore) aucune remarque fielleuse du ministère de la Santé embarrassé il est vrai de 90 millions de doses de vaccin à écouler et pas question de songer à eBay ! — les réseaux sociaux, avec Twitter en ligne de mire via Google Friend Connect, etc. La voracité des datacenters est insatiable !



En second lieu, Google développe et fait massivement la promotion de toutes les formes de terminaux Web : logiciels, et maintenant matériels en ce début d'année 2010. Il faut alimenter et consulter son moteur de recherches tout en étendant plus encore l'espace publicitaire que Google convoite, tout le temps et partout.



Android, le système d'exploitation Open Source de Google, vise particulièrement les constructeurs de terminaux et les opérateurs de télécommunications mobiles qui sont, pour des raisons différentes, intéressés à limiter l'incursion brutale de l'iPhone d'Apple sur leurs prés carrés historiques. Le modèle « moins cher que gratuit » implicite dans la proposition de faire payer aux opérateurs et aux constructeurs une version premium d'Android — alors que la version Open Source est évidemment gratuite — mais en échange d'une commission arrière sur les revenus publicitaires sur l'Internet mobile montre que l'innovation est aussi à la mode dans les business models...



Plus que sur l'iPhone, c'est sur l'Internet mobile que Google a jeté son dévolu. Depuis 2006 Google couvre toute la ville de Mountain View, où est établi son siège social, de WiFi gratuit. (Il a cependant abandonné son plan initial d'en faire de même pour toute la ville de San Francisco en 2007 devant les réticences de son partenaire EarthLink). On avait également parlé de Google pour l'obtention d'une des licences d'opérateur mobile aux USA et le débat sera certainement rouvert après l'annonce, il y a quelques jours, du Nexus One qui signe l'entrée en fanfare du moteur de recherches dans le secteur des équipementiers télécoms.



Rappelons également le coup porté aux opérateurs, cette fois, avec le lancement du service de géolocalisation maison, Latitude, en février dernier. Alors que les fournisseurs d'information géographique venaient à peine de se faire avaler — et au prix fort ! — soit par les fabricants de terminaux (acquisition de Navteq par Nokia fin 2007 pour 8 Mds de dollars), soit par les fabricants de GPS (acquisition de TeleAtlas par TomTom à la même époque pour 2,7 Mds de dollars), Google menace déjà de banaliser cette précieuse information géographique, et gratuitement — voire même l'offrir aux développeurs sur la plateforme Android — alors que ces services de localisation représentent un flux de revenus pour leurs opérateurs.



Le navigateur Chrome, partie émergée du projet Chrome OS, dont Google vient jusqu'à la Gare d'Austerlitz tapisser les couloirs du métro de ses affiches multicolores, veut tailler des croupières à Internet Explorer — avec Firefox de Mozilla en victime collatérale ? (Android utilise quant à lui, WebKit, un moteur de rendu de pages Web en Open Source utilisé, entre autres, — surprise, surprise — dans Safari sous Mac OS X d'Apple.)



Enfin, s'il était besoin de signe plus clair, l'acquisition de AdMob (novembre 2009, 750M dollars), un spécialiste de le publicité sur mobile, finit de convaincre que l'Internet mobile est pour la prochaine décennie le nouveau champ de bataille des Titans du Web. Apple, qui se sent à juste titre visé dans l'euphorie du succès de l'iPhone (2 millions d'iPhone vendus en France en 2009), vient de répliquer magistralement en acquérant l'agence de publicité mobile Quattro Wireless (janvier 2010, 275M de dollars), au milieu de rumeurs grandissantes annonçant la sortie imminente d'une iTablet. De son côté, Microsoft livrait enfin en décembre dernier une application Bing pour l'iPhone.



Alors, l'avenir est-il à l'autorité algorithmique omniprésente de Google ? Le magnat de la presse Rupert Murdoch tente bien de désceller l'un des fondements du business model de Google en cassant net le lien entre accès aux contenus, indispensable au moteur de recherches, et revenus publicitaires tirés des requêtes des internautes. Autre brèche évoquée dans un article de Wired, les «  maquiladoras à pages vues », elles aussi un savant mélange d'algorithmes et de sueur. Le modèle de DemandMedia, par exemple, s'appuie en effet, comme celui de Google, sur un algorithme qui, dans un premier temps nourri des termes les plus populaires dans les recherches, de données en temps réel sur le marché et sur le prix des publicités en ligne, et d'information concurrentielle sur le rang des contenus dans les résultats de recherche, alloue ensuite dynamiquement à des freelances dans le monde entier la tâche (ingrate) de fournir immédiatement du contenu — n'importe quel contenu — sur le sujet, aussi abscons ou superficiel qu'il soit, calculé comme le plus rémunérateur à un instant donné dans le modèle publicitaire en ligne. Le dual de Google dans un certain sens, bouclant ainsi la boucle issue de la requête tapée par l'internaute dans le moteur de recherches : algorithme contre algorithme. (ComScore les place déjà, avec 53 millions de visiteurs mensuels aux USA, au vingtième rang du hit parade des sites Web !)



Une nuit du printemps 2007, de mystérieux panneaux billboard publicitaires s'étaient dressés de part et d'autre de la Highway 101, qui traverse la Silicon Valley du nord au sud, portant des inscriptions cryptiques comme : « L'Algorithme a tué Jeeves » ou encore « L'Algorithme vient du New Jersey ». La perplexité fut de courte durée lorsque Ask.com révélait quelques jours plus tard sa campagne de publicité pour le lancement de son nouveau moteur de recherches.



Prémonitoire ?



ShareThis