Et mercredi soir dernier, Watson remporta haut la main, avec un gain de 77 147 dollars, la compétition de « Jeopardy! », devant ses adversaires, pourtant de première force, Ken Jennings et Brad Rutter. Ce fut, à la télévision américaine, un rare moment d'inspiration Turingo-Kasparovienne : car Watson, comme Deep Blue qui démolit le champion du monde d'échecs, Garry Kasparov, en six courtes parties en 1997, est un logiciel conçu par IBM tournant, pour l'occasion, sur un cluster de 90 serveurs basés sur la nouvelle architecture de microprocesseur Power7 du constructeur.
Superbe — et inquiétante pour certains — démonstration technologique d'un IBM que l'on avait tendance à oublier au palmares de l'innovation, tout ébaubis que nous sommes par l'hypertrophie tentaculaire du moteur de recherche. Mais, finalement, de quoi Watson est-il la démonstration ?
Revenons aux premières minutes du big bang cybernétique : en 1950, la revue Mind publiait un article d'Alan Turing dont le titre, Computing Machinery and Intelligence, plutôt obscur, cachait un programme de recherche révolutionnaire qui devait agiter tout autant les laboratoires où naissait une informatique balbutiante que les philosophes et les sociologues de tous horizons. Concentré sous la forme d'un jeu d'imitation qui est célèbre depuis sous le nom de Test de Turing, la méthode proposée pour répondre à l'éternelle question : les machines peuvent-elles penser ? prend — déjà ! — la forme d'un jeu.
Dans la formulation originale du Test de Turing, un homme et une femme, cachés de l'interrogateur ne communiquent avec lui, indépendamment, que par messages tapés à la machine — on est en 1950, pas de PC ! IBM fabrique des machines à écrire, la Model A Standard Electric Typewriter est un succès mondial depuis deux ans. Les participants s'accordent pour répondre comme « femme » aux questions écrites de l'interrogateur : l'homme faisant de son mieux pour faire croire qu'il est la concurrente, la femme pour convaincre qu'elle seule l'est authentiquement. L'interrogateur s'applique, par des séries de questions aux deux concurrents masqués, laissées à son libre jugement de déterminer qui imite réellement l'autre.
Turing suggère de remplacer l'homme par la machine (la computing machinery du titre) et écrit :
Nous posons maintenant la question suivante : que se passera-t-il lorsqu'une machine jouera le rôle de l'homme dans le jeu d'imitation ? L'interrogateur se trompera-t-il aussi souvent que lorsque le jeu est joué entre un homme et une femme ? Ces questions remplacent notre interrogation originale : les machines peuvent-elles penser ?
Notons immédiatement, pour l'écarter, la difficulté de genre que l'énoncé brut du Test de Turing pourrait susciter chez le lecteur contemporain. Dans les années 1950, on peut penser qu'un interrogateur aurait peut-être moins de difficultés qu'aujourd'hui à distinguer un interlocuteur qu'une interlocutrice tant le répertoire des expériences quotidiennes de l'homme devait différer de celles de la femme à cette époque, dans cette société. (Enoncé d'autant plus problématique ou révélateur au plan psychologique d'ailleurs, si l'on se rappelle des orientations d'Alan Turing qui lui valurent persécution et déchéance de la dite société !)
En revanche, la subtilité instillée dans le Test par l'esprit tortueux de son créateur mérite qu'on s'y attarde un instant. À première lecture, le Test de Turing s'auto-disqualifie, en tout cas pour l'époque à laquelle il est énoncé. La première question de Turing n'en n'est pas une puisqu'en 1950, tout du moins, la machine ne peut pas jouer au jeu d'imitation proposé. Cette capacité étant donnée comme préalable à la réponse que ce jeu doit révéler, le Test ne peut donc être administré. On peut cependant en sauver l'essence, puisque Turing dit : « lorsqu'une machine jouera », anticipant, pour le coup en authentique visionnaire, le formidable développement du calcul automatisé. Bien que candidat d'un jeu aux règles différentes, Watson démontre que le niveau actuel des développements de l'informatique et du logiciel permettent aujourd'hui de juger recevable ce prolégomène.
Mais une seconde finesse apparaît alors. Dans le jeu originalement conçu, la machine doit imiter l'homme en train lui-même d'imiter la femme. (Décidément !) Ne soupçonnerions-nous pas qu'il soit plus facile d'imiter quelqu'un s'appliquant à imiter quelqu'un d'autre que d'imiter purement et simplement ce quelqu'un ?
L'interrogateur du Test de Turing juge d'après la compétence à mener un dialogue, une conversation. Et là réside, au fond, l'intérêt réel du Test qui met à l'épreuve la capacité d'une machine à imiter les interactions humaines. C'est en cela que Watson diffère de votre pèse-personne : à quiconque l'interroge, la balance, répond exactement avec le poids, quelles qu'en soient les variations — tenter de cajoler ou d'influencer l'instrument par de doucereuses injonctions à fournir des réponses plus flatteuses n'entame en rien sa détermination, comme chacun peut aisément s'en convaincre en tentant, s'il ne l'a déjà essayé, la dégrisante expérience.
Le Test de Turing propose donc de considérer l'intelligence à la mesure de la capacité d'intégration de la machine à une organisation sociale — certes, ici, simple et circonscrite — plutôt qu'à la reproduction mot à mot, a-t-on envie de dire, du fonctionnement du cerveau humain. Ce test met donc bien plus l'accent sur la recevabilité de la machine dans le tissu des relations sociales que sur l'architecture et sur les algorithmes employés. Un billet récent de Stephen Wolfram le génie mathématique controversé de A New Kind of Science et du moteur de recherche original Wolfram|Alpha, en forme de plaidoyer pour l'approche radicalement symbolique de la connaissance apparemment à l'oeuvre dans Wolfram|Alpha, montre bien que des architectures et des programmes très différents pourraient prétendre à passer le Test de Turing.
Se demander de quoi Watson est-il la démonstration impose donc de détailler le protocole du Test de Turing avec plus de circonspection. D'abord, remarquons que dans une délicieuse inversion de la direction du Test, le jeu Jeopardy! propose à ses candidats une réponse dont ils doivent trouver la question à laquelle elle répond. La question est la réponse et la (bonne) réponse est ici la (bonne) question. Affiner le Test de Turing avec cette variante conduit à s'interroger sur ce qui se passerait si une machine jouait le rôle de l'interrogateur dans le Test de Turing. (Au fait, dans l'énoncé original de Turing il n'est pas précisé si l'interrogateur est homme ou femme, ce qui, pourrait-on penser, doit influencer sur les probabilités d'un jugement correct.) Turing dit un peu plus loin dans le même article :
Je crois que d'ici une cinquantaine d'années [on y est !] il sera possible de programmer les ordinateurs à jouer le si bien le jeu d'imitation que l'interrogateur moyen n'aura pas plus de 70% de chance de l'identifier correctement après cinq minutes d'interrogation. La question initiale : les machines peuvent-elles penser ? est alors vidée de son sens et ne mérite pas discussion. Cependant je pense qu'à la fin du siècle, le sens des mots et les usages de l'opinion éduquée auront tant évolué que l'on pourra parler de machines intelligentes sans s'attendre à être contredit.
On voit bien que dans l'esprit de Turing, la justesse de ses prédictions à plus à voir avec ce que nous pensons des machines et comment nous nous les représentons qu'avec les développements proprement techniques de ces machines. D'évidence, ce thème a été abondamment exploré par la science-fiction, comme dans Do Androids Dream of Electric Sheep? de Philip K. Dick qui servit de base au film Blade Runner, ou HAL — un IBM peu déguisé — dans 2001 de Clarke et Kubrick. Il a aussi été largement exploré dans les recherches des premiers temps de l'Intelligence Artificielle, avec, par exemple, Eliza de Joseph Weizenbaum qui joue le rôle du psychanalyste dans une consultation dont vous êtes le patient, ou encore Colby de Kenneth Colby qui joua si bien le rôle du malade paranoïaque qu'il trompa 52% des psychiatres amenés à jugés la transcription de dialogues avec la machine. Notons que, dans ce dernier cas, Colby indiqua que les psychiatres (les interrogateurs) modifiaient leur façon de mener le dialogue s'ils étaient avertis qu'un programme pouvait être leur interlocuteur. Une machine peut-elle donc passer le Test de Turing non seulement en l'absence de coopération — la coopération désignant ici un protocole qui volontairement ou non facilite la solution du jeu d'imitation — mais lorsqu'elle est confrontée à un interrogateur entraîné et averti de l'éventuelle présence d'une machine ? Le rédacteur des des questions (les réponses !) du jeu Jeopardy! savait-il que Watson serait candidat ? Une machine aurait-elle pu rédiger ces mêmes questions pour cette émission particulière ?
Sous l'angle maintenant du contenu, de la matière de la conversation du Test, une autre mise en abyme nous attend. Alors que les algorithmes de Google, dont la réputation d'innovation n'est plus à vanter, cherchent les réponses à la question (simplifiée) de l'internaute dans une analyse, au final, statistique d'un énorme volume de documents textuels, Watson, affirmation volontaire du nouveau parangon de l'innovaiton, utilise des algorithmes de traitement de langage naturel et d'inspiration statistique similaire pour trouver la question à la réponse choisie. Si on mettait bout à bout Watson et Google, on aurait une boîte noire à la Searle qui tournerait en circuit fermé — et moins de publicité pour polluer nos écrans ! (C'est d'ailleurs avec une certaine détresse cognitive que nous apprenons aujourd'hui que RenRen, le Facebook chinois — la très authentique concrétisation de la Chinese Room de Searle — annonce sa prochaine IPO sur les marchés américains coupant le riz sous le pied de la triade Goldman Sachs, Digital Sky Technologies, Facebook.)
Enfin, il est tout à fait significatif, qu'à l'époque où Nicholas Carr publie Is Google Making Us Stupid dans The Atlantic et développe son argumentation dans le livre The Shallows, reprenant contre le moteur de recherche la thématique de l'abrutissement des foules, ce soit Jeopardy! qui ait inspiré David Ferrucci et son équipe de sémanticiens à IBM. Neil Postman, dans Amusing Ourselves To Death, dirigeait en 1985 la même critique, avec d'indubitables relents orwelliens, contre la télévision des années 1950-1960 aux Etats-Unis qui portait précisément au pinacle du prime time les jeux de question-réponse : les premières diffusions de Jeopardy! datent de 1964 et ont littéralement enchanté une génération entière de téléspectateurs avides. Car dans ce type de jeu qu'est-il montré en spectacle ? Au final, la capacité des candidats à répondre avec l'exactitude mécanique et systématique aux questions dont la difficulté artificielle est précisément étudiée pour faire ressortir ce comportement machinal. D'où l'espèce de pindarisme dans la rédaction de questions alambiquées portant sur des trivialités auxquelles n'importe qui de sensé n'accorderait la moindre attention qui caractérise ces jeux télévisés et leurs innombrables déclinaisons (par exemple, le très judicieusement nommé Trivial Pursuit). Voici donc des jeux où l'homme doit imiter la machine ; est-il alors surprenant que Watson triomphe, machine qui imite l'homme imitant la machine ? Watson pourrait-il se faire passer pour votre pèse-personne ? Difficile à imaginer sans que vous ne vous en aperceviez rapidement...
En 1997, IBM Deep Blue gagnait son match contre Kasparov, le champion du monde d'échecs, en poussant à fond ce qui le distinguait de son opposant plutôt qu'en cherchant à l'imiter, l'exercice d'algorithmes exhaustifs dits de brute force explorant toutes les situations et développements possibles grâce à une capacité de calcul inégalée à l'époque. L'expression la plus radicale du caractère machinal sortait vainqueur là-aussi d'un jeu, dont on pensait jusqu'alors que la combinatoire proprement monstrueuse dominait encore la brute dans la machine. De quoi Deep Blue fut-il la démonstration ? Sur son succès IBM a créé le Deep Computing Institute (DCI) qui s'attaque à des problèmes de prévisions météorologiques, de fraude dans les transactions de cartes de crédit et d'analyse des logs des call-centers téléphoniques. Deep Blue n'a plus jamais joué aux échecs ; il est exposé au Smithsonian Institute.
IBM nous promet que Watson (for a smarter planet) inaugure une ère meilleure dans les domaines de la santé, de la finance et des services au consommateur. Peut-être que dans quinze ans, dans un remake d'une Nuit au musée dans l'univers de The Matrix et de Skynet c'est Watson qui commentera les visites guidées au Smithsonian répondant aux questions des turbulents jeunes androïdes en sortie du mercredi après-midi...