samedi, novembre 20, 2010

La République Démocratique des Données


La donnée, dit le Littré, est un point sur lequel on fonde un raisonnement. (C'est également, dans un sens quelque peu désuet — quoique, voir la Loi de Finances 2011 —, une distribution d'argent faite aux pauvres : «  Plus la donnée avait été nombreuse, plus la charcutière était aise  », Saint-Simon.) Dans sa forme moderne, « la représentation d'une information sous une forme conventionnelle destinée à faciliter son traitement », la donnée se détache de la perception immédiate et du caractère d'observation incontestable qui étayait la raison. Dans la « convention » et la « facilitation du traitement » qui priment maintenant au dépens de l'exercice de la faculté rationnelle, point alors comme une sourde menace.

 



La facilitation du traitement était encore, il y a peu, un objectif considéré comme difficile à atteindre dans le contexte de l'explosion de la production de données liée à l'hypercroissance du Web et la multiplication des terminaux connectés. En comparaison, les tabulatrices de la Deutsche Hollerith-Maschinen Gesellschaft mbH (Dehomag), les trieuses de la Hollerith (« Übersicht mit Hollerith Lochkarten »), les interclasseuses et les perforatrices d'IBM étaient de bien meilleures « facilitatrices » de l'avènement des totalitarismes aux lendemains chantants du court vingtième siècle. Mais les technologues de l'époque contemporaine y travaillent activement.

 



Prenons Talend, l'éditeur français Open Source, qui vient de boucler une phénoménale levée de fonds de $34m — dans un marché du private equity early stage notoirement moribond — et annonce simultanément l'acquisition de l'allemand Sopera, un spécialiste de l'intégration d'applications d'entreprise. En janvier 2009, Talend avait déjà réussi le tour de force de lever $12m auprès des fonds de Balderton Capital et d'AGF Private Equity, et d'attirer à son Conseil d'administration Bernard Liautaud, jeune retraité de BO, bienheureusement préservé de la réforme nationale sous les dorures rassérénantes de Balderton sis dans les plus chics quartiers de la fiscalement accueillante capitale britannique. Talend est la star montante de la transformation des données (ETL), de la gestion des données de référence (Master Data Management, MDM, avec le rachat des actifs d'Amalto Technologies en 2009) et, depuis peu, de l'intégration des données. Comme Pentaho — $32m levés en quatre tours de financement depuis août 2005 — et Jaspersoft — $24,5m levés en 2007-8 pour son quatrième tour de table — Talend fait partie des pionniers des défenseurs de la démocratisation du traitement facilité des données, qui pratiquent un Open Source militant visant à une « facilitation » par et pour le plus grand nombre.

 



C'est également la démocratie qui est invoquée aux États-Unis comme auspices du site http://www.data.gov/ mis en place par l'administration américaine pour « faciliter l'accès du public aux jeux de données de grande valeur, tout prêts pour le traitement automatique, produits par la branche exécutive du gouvernement fédéral ». Là-bas le discours politique se drape des vertus de la transparence devenue inattaquable, quant aux principes, dans la bien-pensance narcotique de L'Empire du Bien. (Il est vrai que l'opacité semblait plutôt la règle que l'exception et depuis fort longtemps.) Mais la transparence n'est pas non plus sans le péril d'un intégrisme insidieux comme nous en alertait Lawrence Lessig, il y a déjà quelques années.

 



De plus, la touche sociale de rigueur du site invite les citoyens à participer au gouvernement en pratiquant leurs propres analyses de données, en conduisant leurs propres recherches et enquêtes sur la base des données fédérales facilement accessibles et mécanisables. À croire que la dissémination sur Internet d'outils techniques comme le langage R, les algorithmes de calcul massivement réparti comme Hadoop, Mahout, ou la Google Prediction API, les infrastructures de gestion de grands volumes de données sur le cloud, comme Azure, EC2/S3, BigQuery, et leurs indispensables outils de navigation/visualisation à la portée du simple mortel, le tout neuf Google Refine, DreamFace Interactive, ou encore Ormetis et le projet Crescent dans l'univers Silverlight de Microsoft, avaient instantanément transformé la population en un bataillon de statisticiens chevronnés entonnant en choeur l'aria du test de Breusch-Pagan de l'hypothèse nulle d'homoscédasticité ! (Bien qu'il y soit question d'analyse des résidus, ce n'est pas du tout ce qu'une perversité peccamineuse vous ferait imaginer !)

 



Pourtant la fin de l'aventure de Swivel, le site qui se présentait comme le premier outil de business intelligence collective — sociale dirait-on dans le mythe modernisé — présente un caractère admonestatoire qui a le goût de l'antidote à ces excès de délégation démocratique. En revanche, opéré par IBM — celui-là même des tabulatrices Dehomag — le site ManyEyes, quant à lui, continue de capturer et visualiser données et corrélations par et pour le bien de tous.

 



Dès la fin des années 1950, l'un des projets de la Staatssicherheitsdienst consistait à automatiser, grâce aux procédés mécanographiques, les archives de la sinistre NS-Archiv des Ministeriums für Staatssicherheit der Deutschen Demokratischen Republik. Les archives initiales de 1953 réunissent une collection de fragments de dossiers personnels et de dossiers d'affaires provenant particulièrement des temps du régime national-socialiste (de l'appareil administratif du Reich) et aussi des années d'après-guerre (de l'appareil administratif de la Zone d'occupation soviétique et de la R.D.A.). Le département XII de la SSD devait l'enrichir considérablement jusqu'en 1989 d'un corpus de données que l'on qualifie aujourd'hui données personnelles ou privées dans la propagande du prosélyte, mais éphémère, Secrétariat à la Prospective et au Développement de l'économie numérique récemment remanié.

 



Il n'est qu'à lire le dernier pamphlet d'O'Reilly, What Is Data Science?, — dans le cas des moteurs de recherche et des réseaux sociaux ne devrait-on pas parler de prises plutôt que de données ? — pour voir refleurir ces idées sous de modernes atours — mais c'est là-même la définition du 2.0 — et deviner derrière le propos irénique que le projet des pionniers au-delà du Rideau de fer a peut-être finalement abouti, un demi-siècle plus tard, mais pas à l'endroit de sa conception ni vraiment sous le nom envisagé, et encore à une échelle proprement inimaginable à l'époque. Nous n'avons plus ni la R.D.A., ni la mécanographie triomphante mais nous avons Facebook et ses API.



mercredi, novembre 10, 2010

Le réseau straussial


Il en est du réseau social comme de l'hystérie. Quand on s'est avisé de douter qu'on pût arbitrairement isoler certains phénomènes et les grouper entre eux, pour en faire les signes diagnostiques d'une maladie ou d'une institution objective, les symptômes eux-mêmes ont disparu, ou se sont montrés rebelles aux interprétations à visée unifiante. Chercherait-on de même à catégoriser les manifestations objectives du Web 2.0 — un terme semblant lui-même en voie d'obsolescence : plus trace même du terme Entreprise 2.0 dans les papiers la conférence Enterprise2.0 elle-même ! — que ces caractéristiques que l'on y associait naguère semblent être en vérité les plus banales et présentes à l'évidence dans le tissu existant des applications d'entreprises autant que des services Web grand public.

 



Considérons un instant cette forme inédite de totémisme sur les réseaux sociaux que l'on peut sans doute voir dans les systèmes de classification employés par les groupes même qui s'y forment : les fameux badges de FourSquare, ceux de MySpace, la nouvelle version des Groupes Facebook dévoilée le mois dernier, etc. Les réseaux sociaux encouragent leurs utilisateurs à y construire des représentations, réelles ou imaginées, d'eux-mêmes sous les habits desquelles ils sont alors invités à parader, comme rituellement. L'articulation des "listes d'amis" et des "groupes d'appartenance" servent alors de marqueur d'identité pour le propriétaire du profil correspondant.

 



De la réponse à la simple question "Est-ce mon ami ?" dépend ainsi l'inscription d'une communauté égocentrique dans une forme d'existence, numérique certes mais publique, sur le réseau social. Par le jeu combinatoire de ces communautés imaginaires, les membres du réseau affichent qui ils sont et se positionnent culturellement. Les groupes sont, à proprement parler, les mythes qui ont aujourd'hui cours dans le réseau social, construits, dans la plus pure veine structuraliste, pour être faits et défaits, assemblés et réassemblés au gré de la dynamique de leurs démographies.

 



Cet élan classificatoire qui vise à épuiser le graphe social serait, au fond, une nouvelle manifestation de la pensée sauvage brillamment analysée par Claude Levi-Strauss. Et, de fait, quelle différence vraiment entre les Algonquins Ojibwa ou les Wongaibon/Dangati d'Australie, d'une part, et les réseauteurs contemporains hypnotisés par leur Wall, d'autre part ? Le réseau social, rien moins que le Temps du Rêve de notre société numérique ?

 



Comme pour étayer l'approche structuraliste à la Levi-Strauss, qui a lui-même toujours été intéressé et au fait des travaux mathématiques de son temps, le sous-continent que constitue la théorie des réseaux dans la théorie des graphes, a connu ces dernières années de formidables développements théoriques et pratiques. Parmi les explorateurs-découvreurs de cette faune mathématique encore inconnue il y a dix ans mentionnons des auteurs indispensables comme, par exemple, Duncan Watts et Steven Strogatz, Albert-Lászlo Barabási et Réka Albert, Stuart Kauffmann, Sergey Dorogovtsev, Mark Newman, ou encore Eric Bonabeau qui les premiers ont produit les taxinomies de ces espèces sauvages inédites que sont les scale-free networks, les small-world networks, ou le farouche et monumental Composant Géant du graphe aléatoire dont l'attachement préférentiel peut vous étouffer dans son étreinte !

 



Ce bestiaire combinatoire est la matière même de la dynamique structurante des réseaux sociaux. Il peut jouer le rôle démystificateur des réseaux sociaux, comme en leur temps les (plus simples) oppositions et permutations dévoilaient les structures analogues dans la comparaison des mythes menée par Levi-Strauss.

 



Dans un renversement remarquable, la pensée sauvage qui trouvait dans la Nature le jeu de construction de ses mythologies classificatrices du monde s'empare maintenant des abstractions culturelles du réseau social comme matériau de construction du monde numérique.



ShareThis