lundi, mars 26, 2007

La Salon du livre n'a pas eu lieu

À quelques jours d'intervalle, l'actualité fournit plusieurs exemples discordants de l'impact d'Internet sur la « Sphère Gutenberg », le mode de production et de consommation de la culture essentiellement basé sur l'imprimé.

Fondé en 1865, installé depuis des lustres dans le Chronicle Building, un bâtiment historique de San Francisco, le quotidien San Francisco Chronicle est un des fleurons du patrimoine culturel de la Bay Area. Les rumeurs de difficultés récurrentes et de licenciements animent malheureusement les blogs depuis la semaine dernière. Les tentatives d'explication, les théories et leurs critiques, les prédictions et leurs contre-prédictions, innombrables, fleurissent de toutes parts entourant d'un brouhaha auto-entretenu le message central : « news is broken » (le modèle du quotidien d'actualités est cassé), comme le dit Phil Bronstein, le directeur de la rédaction du journal.

La presse informatique elle-même n'est plus à l'abri. Le vénérable - à l'échelle de cette indsutrie - InfoWorld, présent dans tous les kiosques de la Silicon Valley et au-delà depuis 1978 vient d'annoncer, la même semaine, qu'il mettait fin à son édition papier pour ne plus se consacrer qu'à son site Web. Pour nous autres, jeunes aventuriers de la haute-technologie, fraîchement débarqués à Palo Alto au début des années 1980, InfoWorld était l'alpha et l'omega des sources d'information sur la révolution naissante du PC et l'avènement de l'interface utilisateur graphique, le chroniqueur infatigable d'une industrie en plein développement qui se construisait sous nos yeux. Aujourd'hui la collection des quelques numéros qui ont échappé aux nombreux déménagements va peut-être devenir un « collector », une pièce rare de bibliothèque !

Précisément.

Le même Tim O'Reilly, à l'origine de l'information sur le San Francisco Chronicle - le journalisme de « scoop » se porte dont toujours bien, merci ! - est également le premier à se réjouir des promesses de la numérisation généralisée des contenus. Trouver et lire les livres est, dit-il, à l'évidence le premier bénéfice de la numérisation des contenus. Pour les étudiants et les enseignants, Google Book Search peut mettre fin aux vains parcours des labyrinthes des grandes bibliothèques universitaires, aux négociations byzantines avec de sourcilleux bibliothécaires, aux enquêtes quasi-policières pour suivre les traces évanescentes laissées par un ouvrage d'un rayonnage à l'autre, d'une institution à l'autre. Mais plus encore, il devient possible, une fois numérisé, de « calculer » sur ce corpus : comparer, indexer, analyser, relier, commenter, de façon interactive ou automatique.

C'est bien ce dont on s'est aperçu en Europe au cri d'effroi poussé par notre Jean-Noël Jeanneney national il y a deux ans devant l'annonce du programme de Google. Son essai, qualifié de « tonique » par Pierre Assouline, « Quand Google défie l'Europe : Plaidoyer pour un sursaut », marque les enjeux symboliques considérables sous-jacents à ce débat.

C'est aussi cette semaine qu'ouvre en ligne la contribution française à la Bibliothèque Numérique Européenne, apothéose du directeur de la BNF sur le départ. Ce service est accessible gratuitement par n'importe quel internaute. Il donne accès à 12.000 ouvrages tombés dans le domaine public, que l'utilisateur peut lire, imprimer ou télécharger en format PDF (mode image ou texte). Et, bonne surprise, non seulement le site ne s'est pas écroulé le jour de son ouverture - comme malheureusement la plupart des services de consultation mis en ligne par la puissance publique de l'IGN à l'INA - mais on y trouve facilement les textes les plus curieux comme, par exemple, la « NOTE SUR LE DÉVELOPPEMENT DES FONCTIONS EN SÉRIES ORDONNÉES SUIVANT LES PUISSANCES ASCENDANTES DES VARIABLES » d'Augustin-Louis Cauchy en 1846 - indispensable à la compréhension de la relation entre continuité et divergence.

Bien qu'elle soit à vocation européenne, l'initiative française compte seulement comme véritables partenaires la Hongrie et le Portugal. Le catalogue du service Europeana intègre ainsi 7.000 ouvrages en français issus de la BNF mais également 4.000 hongrois et 1.000 portugais. Les livres numérisés de ces deux pays ne sont cependant pas encore réellement intégrés dans la plate-forme Europeana. Pour les consulter, l'internaute est redirigé vers les services en ligne des bibliothèques nationales hongroises et portugaises. Mais l'interopérabilité des plates-formes est en cours de développement, ont assuré les représentants de la BNF. Et l'on constate, en effet, que l'interface utilisateur d'Europeana est, au final, très proche de celle de Gallica, la bibliothèque numérique de la BNF. Le projet BNE est aujourd'hui financé à 100% par l'État français à hauteur de 10 millions d'euros pour 2007, faisant suite à une première enveloppe de 3,3 millions d'euros en 2006. Ce financement est pris sur les recettes de la taxe parafiscale (de 1976) sur les appareils de reproduction, tels que les photocopieurs fabriqués ou importés en France. La Commission européenne n'a pour l'instant investi aucun euro et Bruxelles ne devrait pas financer la numérisation à proprement parler des livres. Que va-t-il advenir du projet ?

Bruxelles est évidemment plus préoccupé par la préservation du modèle de la presse face à ce qu'on a pris l'habitude d'appeler de ce côté de l'Atlantique les « offensives » de Google. En février dernier, la justice belge a confirmé la condamnation du moteur de recherche américain : fini pour Google l'aspiration des infos des journaux belges sans leur autorisation. L’affaire remontait à avril 2006, quand Copiepresse, une coopérative défendant les droits d’auteurs du Soir, de la Libre Belgique et de la Dernière Heure exigea de Google News, le site d’actualités du moteur de recherche, qu’il cessât de reprendre leurs infos, photos et graphiques. Pas trop affecté en apparence, Google persiste. Pour la première fois au Salon du Livre, les nouvelles technologies ont leur espace dédié. La « Plate-forme Numérique » rassemble imprimeurs numériques, sociétés de numérisation d'ouvrages, fabricants de livres numériques et... Google, qui s'est offert un stand aux couleurs de son service de recherche sur livres.

La grande initiative de récupération de contenus des blogs et wikis individuels est l'autre temps du moteur de numérisation de Google, MSN et quelques autres. Non contents de chercher à automatiser ce « calcul » sur le corpus imprimé déjà existant, les Numérisateurs invitent en permanence chacun à « partager », à publier, à « participer » à cette « Naked Conversation » - du titre du best-seller (papier et en ligen !) de Robert Scoble et Shel Israel sur le phénomène blog - et à leur remettre toujours plus de contenus numériques. Ce qui ne va pas, bien sûr, sans frictions, en particulier sur les droit d'auteurs et le copyright : voyez Google et Viacom à la lutte sur l'épineux problème du copyright des images montrées sur le site vidéo vedette YouTube !

Sur cet écran, bientôt, Votre Livre réinventé...

dimanche, mars 18, 2007

Les géants de l'industrie informatique se disputent la téléphonie

Comme si le front Google ne suffisait pas à Microsoft, voilà que s'ouvre un nouveau champ de bataille entre géants de l'industrie. L'actualité récente laisse en effet à penser que Microsoft et Cisco se mettent en ordre de bataille pour une confrontation sur le terrain des télécommunications.

La rumeur avait circulé fin janvier, puis a trouvé une nouvelle ampleur cette semaine, selon laquelle Microsoft rachèterait la startup Tellme Networks (320 personnes et plus de $235m de capital risque levés quand même !), à une valorisation dépassant $800m. Tellme développe des interfaces de commande vocale et des serveurs d'applications « audiotel » ; c'est un spécialiste de VoiceXML, le langage dérivé de XML pour décrire les applications vocales. Pourquoi un tel prix, qui en ferait l'une des plus chères des acquisitions de Microsoft après Navision en 2002, Great Plains Software en 2001 et Visio en 1999 ? Certes les applications vocales de Tellme Networks trouveraient certainement une place dans la suite d'applications d'entreprise de Microsoft, mais est-ce tout ?

L'observateur de l'industrie informatique Om Malik est allé pêcher dans une interview de Steve Ballmer au Wall Street Journal en mai 2006 une remarque, passée à l'époque inaperçue, mais qui pourrait jeter une lumière différente sur cette acquisition. « La ligne de crête du champ de la bataille qui nous oppose à Google dans la recherche de proximité [c'est-à-dire, information locale, petites annonces, etc.] passe par la téléphonie mobile » avait déclaré le CEO du géant de Redmond. Si l'emprise de Google sur la recherche sur le Web est en effet assez incontestable, la recherche sur le mobile est encore un terrain à conquérir. D'ailleurs, sur ce sujet, Microsoft était venu jusqu'à Paris en février 2006 acquérir la startup MotionBridge et son moteur de recherche pour les services mobiles. L'acquisition de Tellme Networks permettrait à Microsoft de se renforcer singulièrement dans ce secteur et de rendre Windows Mobile à la fois bien plus « user-friendly » et conforme aux architectures déjà en place des opérateurs mobiles.

Chez Google, après la messagerie instantanée, on fait toujours état de plans pour la téléphonie IP qui iraient sur ces mêmes brisées. Google Talk offre aujourd'hui quelques possibilités VoIP, mais pas au standard SIP employé par la grande majorité des acteurs de la téléphonie Internet - à l'exception fameuse de Skype. Dave Girouard, patron de la division entreprise de Google, a déclaré en décembre dernier que la VoIP de Google se déploierait sur la base et en fonction du succès des Google Apps, ces applications de bureautique hébergées par le moteur de recherches. Les esprits fertiles pourront rapprocher ces déclarations, de celles plus techniques sur l'évolution de Google Talk vers le standard SIP, plus répandu, et des fameux datacenters aux débits d'accès faramineux dont Google multiplie depuis un an les constructions sur tout le territoire américain. Il faudrait assez peu, à ce stade, pour que Google ne commence à offrir des services d'opérateur téléphonique VoIP. Puis, sans effort indu d'imagination, des services de téléphonie IP aux mobiles.

Mais, cette semaine, ce n'est pas de Google qu'est venue la réplique aux mouvements de Microsoft dans l'arène des télécommunications. C'est Cisco qui défraye la chronique en annonçant l'acquisition de WebEx, le fournisseur d'outils et de services de téléconférence sur le Web (3,2 milliards de dollars si la transaction est conclue). WebEx, célèbre pour ces outils de vidéo et d'audio-conférence sur le Web, possède également, depuis son acquisition d'Intranets.com, des outils de partage de documents et de collaboration qui permettront à Cisco d'héberger des services comparables à ceux de LiveMeeting de Microsoft - qui les avait lui-même acquis dans l'achat de PlaceWare en 2003 (pour $200m).

Notons que dans les deux cas le prix d'acquisition payé par les deux géants est très élevé, même si WebEx affichait déjà $380m de revenus l'année dernière. Mais l'enjeu d'une position prépondérante sur le marché de la « convergence » des services de voix et de données aux PC et aux mobiles vaut assurément ces investissements majeurs.

lundi, mars 12, 2007

Le retour discret de l'IA sur le Web

Se pourrait-il que l'Intelligence artificielle (IA), domaine de recherche qui connut son heure de gloire à la fin des années 1970 et pendant les années 1980 avant de disparaître totalement des radars, fasse discrètement une timide réapparition sur le Web ?

Tout d'abord, les zélotes seront prompts à répliquer d'emblée que l'IA loin d'avoir disparu est, au contraire, omniprésente mais souvent invisible à l'oeil non averti. Admettons donc de bonne grâce, qu'aux tréfonds des « clearinghouses » des transactions par carte de crédit vibrent toujours quelques systèmes experts et autres réseaux de neurones, que dans les boîtiers anti-spam, que nous installons par douzaine, des réseaux probabilistes continuent aujourd'hui à prolonger les intuitions inductives du Reverend Thomas Bayes, et que dans les temples manufacturiers du taylorisme, la programmation par contraintes - informatique et toute virtuelle s'entend ! - optimise discrètement mais sûrement les délocalisations. Dont acte.

Mais, me semble-t-il, à regarder le chemin parcouru par la discipline on est arrivé assez loin du projet des fondateurs, comme John McCarthy (Turing Award en 1971) qui déclarait que l'IA était le génie et la science de la construction de machines intelligentes et, en particulier, de logiciels intelligents. Allen Newell (1927-1992), autre père fondateur de la discipline, précisait que l'IA se rapprochait un peu des tentatives comparables d'utilisation de l'ordinateur pour comprendre l'intelligence humaine mais l'IA n'avait pas à se limiter aux systèmes biologiques observables dans la nature. Aujourd'hui on dispose donc de programmes qui battent les champions du monde d'échecs et comprennent les conversations téléphoniques mais sont incapables de se débrouiller comme un enfant de quatre ans le ferait.

Le mariage morganatique de l'IA aux intérêts séculiers et commerciaux des marchands de règles métier ne fait pas l'affaire du W3C qui entend bien revenir à la noblesse du programme originel inspiré des fondateurs. Tim Berners-Lee avait pris l'initiative, en février 2004, du Web Sémantique (Semantic Web) une tentative de « redonner du sens au Web ». Avec de nouveaux standards, tous dérivés de XML, comme RDF (Resource Description Framework) et OWL (Web Ontology Language) il s'agit de représenter de l'information, et plus seulement des données, et échanger des connaissances sur le Web.

Aujourd'hui le W3C annonce « l'incubation » d'une nouveau projet : raisonnement sur l'incertain pour le World Wide Web, dans la lignée directe du Web Sémantique. Que nous dit, en effet, le W3C ?

- l'information extraite du Web est typiquement incomplète ;
- beaucoup des informations présentes sur le Web sont elles-mêmes incertaines ;
- elles sont aussi parfois incorrectes ou partiellement correctes ;
- la prolifération d'ontologies incompatibles entre elles menace l'harmonie du Web Sémantique, comment échanger ces fameuses connaissances avec certitude ?
- enfin, la généralisation de l'architecture orientée services impose la résolution « au vol », i.e. à l'exécution, des ressources nécessaires aux applications Web : le raisonnement sur l'incertain permettrait d'avancer dans les situations où l'identification des ressources n'est pas encore définitive.

Tout utilisateur de Wikipedia, par exemple, s'est certainement déjà rendu compte que l'on nage dans l'incertitude ! Et que dire, en effet, des résultats des moteurs de recherche ? La mission du groupe de travail est d'identifier ces situations d'incertitude à l'échelle du Web et de proposer des approches pour y apporter une solution ou, à défaut, une mesure. Mon intuition me dit que l'on va voir revenir quelques uns des grands canons de l'IA : ensembles flous (Zadeh), théorie de Dempster-Shafer, la logique des défauts de Reiter, réseaux bayesiens, tribus et probabilités vont reprendre du service sur le Web.

Au même moment, quelques initiatives privées notables s'attaquent à la question. Quelques jours après le rachat de Medstory, un moteur de recherche vertical à base d'IA, par Microsoft, c'est au tour de Danny Hillis, une célebrissime figure de la communauté IA, d'annoncer sa nouvelle et ambitieuse startup, Metaweb technologies. L'esprit particulièrement fécond de Danny Hillis avait déjà mis au point la fameuse « Connection Machine », au MIT en 1983 pendant son doctorat, et créé une startup, Thinking Machines (quel nom !), pour exploiter cette première machine massivement parallèle - 65.536 processeurs pour la plus grande. Après la disparition de Thinking Machines en 1994, Danny Hillis avait rejoint le centre de recherche et développement de la Walt Disney Company. Sa nouvelle idée est tout simplement démesurée. Metaweb veut créer une base de données centralisée de toute l'information numérique publique, Freebase, à laquelle tout un chacun est appelé à contribuer. Dans cette implosion imaginée du Web, les informations très structurées permettent à Freebase de faire des inférences, de trouver des connexions, d'induire des relations entre les données, de déduire de nouvelles informations, bref de « donner du sens » aux résultats de requêtes plutôt que de présenter de (très) longues listes de documents à la valeur incertaine.

De la part de tout autre que Danny Hillis, on s'interrogerait sur les effets de la recherche et développement prolongée chez Walt Disney, mais le parcours du prodige de l'IA parle plutôt en sa faveur. Tim O'Reilly, tourneur de métaphore tournant parfois à l'adynaton, s'est écrié : « c'est comme construire les synapses du cerveau global ! ». Freebase a déjà reçu quelques contributions importantes de Wikipedia, bien sûr, mais également des informations sur 4 millions de morceaux de musique du site Musicbrainz, sur des restaurants du guide en ligne libre ChefMoz.org, etc.

Voilà qui rappelle un plus ancien projet encore, lancé en 1984 par une autre figure culte du monde de l'IA, Doug Lenat. Le projet, Cyc, fut qualifié à sa naissance de « quête à long terme de la véritable intelligence artificielle ». Rien moins. Cyc a également donné lieu à la création d'une startup, Cycorp, en 1994, mettant à la disposition des développeurs une base de connaissances de plus de 300.000 concepts, du plus simple au plus complexe, et de plus de 3 millions relations entre eux qui constituent le « sens commun ». (Descartes écrivait d'ailleurs : « Le bon sens est la chose du monde la mieux partagée : car chacun pense en être si bien pourvu, que ceux même qui sont les plus difficiles à contenter en toute autre chose, n'ont point coutume d'en désirer plus qu'ils en ont », sans penser peut-être au Web intelligent !) Cyc est déjà capable de répondre à des questions posées en « langage naturel », encore un compartiment de recherche en IA qui revient sur le devant de la scène.

Saluons donc le retour discret de l'IA sur la scène du Web, même si l'on n'y trouve, pour l'instant, qu'une vue assez aristotélicienne de la connaissance.

dimanche, mars 04, 2007

Avec l'acquisition de Medstory, Microsoft prend une position forte dans le secteur de la Santé

Le titre de Microsoft a gagné 2 cents au NASDAQ, lundi dernier, le 26 février. Soit une hausse de sa capitalisation boursière de près de 196 millions de dollars. Ce lundi, Steve Ballmer, orateur « keynote » invité à la conférence de la Healthcare Information and Management Systems Society (HIMSS) qui vient de se terminer à la Nouvelle Orléans, annonçait l'acquisition par Microsoft d'une jeune startup de Foster City, en Californie : Medstory. Lancée l’été 2006, la version grand public de Medstory est un moteur dédié à la santé qui sépare les résultats destinés au grand public des résultats orientés vers la recherche scientifique. Medstory offre des fonctionnalités très complètes comme l’affichage sélectif des types de résultats (actualités, presse et média, audio et vidéo) et l'on peut créer un fil RSS pour surveiller les nouveaux résultats de ses requêtes personnalisées.

Medstory avait par ailleurs noué en octobre 2006 un partenariat avec le Wall Street Journal Online et le site Breastcancer.org, pour enrichir ses résultats concernant les sociétés et les résultats concernant les cancers du sein. Le moteur permet également aux entreprises des média de valoriser leur contenu médical de manière différenciée. La société Medstory était spécialisée à l’origine dans les solutions logiciel pour l’industrie pharmaceutiques, biotechnologique et les organisations gouvernementales aux États Unis.

Après celle, en juillet 2006, de Azyxxi, la solution de gestion du dossier médical développée par le Washington Hospital Center, cette nouvelle acquisition permet ainsi à Microsoft de se rapprocher une nouvelle fois de l’univers médical avec l’objectif avoué de proposer un ensemble d’applications standardisées aux professionnels de la santé, avec pour cible principale les hôpitaux et les cliniques. Cette suite logicielle serait complétée par un ensemble de services dédiés aux consommateurs. La dizaine d'employés de Medstory rejoint donc l’équipe de 120 collaborateurs du département Health Solutions de Microsoft sur son campus de Mountain View, sous la responsabilité hiérarchique de Bill Gates.

Sans être grand analyste, on aura vite compris que l'agitation récente de Google sur ce secteur, et en particulier les déclarations d'Adam Bosworth, gourou technique, recruté de BEA précisément pour prendre la tête d'une division « Healthcare Information Services », encore dans les limbes mais clairement en préparation, n'est probablement pas pour rien dans ce mouvement stratégique de Redmond. Steve Case, l'ancien patron charismatique et prodige de la bulle Internet, fondateur et dirigeant d'AOL et artisan de sa fusion avec Time Warner, est aussi sur les rangs avec sa nouvelle engeance, Revolution Health Group, qui devrait offrir plus de 125 outils et services en ligne « pour mener une vie plus saine » - la « Santé 2.0 », en quelque sorte - un portail communautaire sur l'information relative à la santé. Alors, simple nouveau front ouvert dans la guerre Google/Microsoft, décidément bien déclarée après la mise en production des « Google Apps » empiétant clairement sur les plates-bandes Office du géant de Redmond ? Google annonce une « health URL », une adresse électronique de santé, personnelle et grand public ; Microsoft réplique par un moteur de recherches vertical, centré sur l'information de santé, grand public et recherche scientifique. Rien de plus, vraiment ?

Mettons au crédit de Microsoft d'avoir également une vue à un peu plus long terme ! Car le moteur de recherches vertical de Medstory est, à y bien regarder, peut-être bien plus révolutionnaire que l'observateur blasé pourrait le supposer, lui qui n'est pas ému outre-mesure par les levées de capital-risque de nos champions nationaux, Sinequa et Exalead, presque simultanément annoncées. (L'ombre gothique de Quaero, maintenant abandonnée par la Walkyrie teutonne, plane un instant sur nos patriotes économiques au milieu du gué.) Esther Dyson, figure de l'industrie reconnue depuis plus de vingt ans (Release 1.0, PC Forum, etc.), mais également investisseuse de la première heure, à titre personnel, dans Medstory a vendu la mèche. Dans son blog, tenu sur le très « hype » site d'Arianna Huffington, Esther Dyson révèle que « Medstory n'est pas tant un moteur de recherche qu'un moteur d'ontologie ». Diable ! Éclaircissant ce cryptogramme, elle précise ensuite « le moteur est capable d'identifier les concepts dans le secteur de la santé, plutôt que de se contenter de marquer les simples mots clés ou les liens entre sites ».

Les grands mots, « ontologie », « concepts », sont lâchés. Et c'est bien là l'ambition de Medstory. Celle-ci s'explique si l'on creuse un peu plus avant l'historique du moteur de recherches. Medstory est le fruit des longues années de son fondateur, le Dr Alain Rappaport, dans les domaines de la médecine et de l'Intelligence artificielle (IA). Au début des années 1980, la France n'a pas su retenir ce docteur en pharmacologie moléculaire de Necker/Enfants-Malades, parti s'établir aux USA, d'abord comme chercheur à la prestigieuse université de Carnegie-Mellon, creuset des sciences cognitives, alors balbutiantes. C'est dans ces laboratoires, parmi les plus féconds de l'informatique et de l'IA, avec le MIT et Stanford, que dans les années 1980 et 1990 il développe et publie algorithmes, travaux de recherche, et réalisations industrielles pour une approche « cognitiviste » de la représentation des connaissances. Par ailleurs, l'entreprise qu'il a co-fondé à Palo Alto en 1985, Neuron Data, connaît, quant à elle, un beau succès et file une trajectoire qui la mène à la cotation au NASDAQ, exploit notable pour une société lancée à l'origine par des français frais débarqués dans la Silicon Valley. L'intérêt pour la modélisation des connaissances, et, en particulier, dans le domaine de l'information médicale, secteur offrant une combinaison unique de caractéristiques exemplaires (long historique de formalisation, institutionnalisation ancienne, recherche scientifique très active, intérêt du grand public, impact économique important et mondial, terrain de réconciliation de savoirs expérimentaux et de connaissances théoriques: bref tout pour séduire le scientifique de la « cognition »), vient donc de loin dans l'historique de Medstory. Les technologies de Medstory sont un concentré de vingt ans de recherche et de succès en IA appliquée.

Dans un papier, écrit avec Marty Tenenbaum, collaborateur de Medstory et fondateur de CommerceNet, dont le titre est véritablement annonciateur « AI Meets Web 2.0: Building the Web of Tomorrow » (L'IA rencontre le Web 2.0: comment construire le Web de demain), cet héritage technologique est mis en avant. Le constat que la science est devenue, à l'évidence, multi-disciplinaire et hors de portée d'un seul individu ou d'un seul groupe est le point de départ de la réflexion. Les communautés scientifiques s'appuient de plus en plus sur le Web pour travailler, échanger et communiquer : revues scientifiques publiées en ligne, portails, services d'information, de recherche, de citations ont fleuri ces dernières années. C'est probablement dans ces communautés scientifiques que se trouvent d'ailleurs les premiers exemples opérationnels et quotidiennement employés de la fameuse Architecture Orientée Services (SOA). Mais Medstory va au-delà de cette Science Orientée Services : les recherches du Dr Rappaport remettent l'accent sur la « connaissance », visant le partage de l'expertise et des connaissances scientifiques à grande échelle.

L'architecture technique de Medstory est présentée comme un véritable « grid computing » à base de connaissances (ici médicales). L'architecture répartie en agents intelligents, qui embarquent des connaissances du domaines - les fameuse « ontologies » vantées par Esther Dyson - permet de mobiliser les différentes communautés scientifiques en réponse à des objectifs globaux mettant en jeu une variété de sous-domaines habituellement compartimentés (bases de données d'expressions de gènes, protéomique, analyse structurelle 3D, unités de séquençage de gènes, analyse phylogénique, données des essais cliniques, tests de population, etc.). D'où la vocation première de Medstory d'opérer un Web de coordination de la recherche appliquée, bénéficiant de l'automatisation de la collaboration et de l'échange de connaissances entre domaines scientifiques. La déclinaison grand public en un moteur de recherche vertical, dévoilée à l'été 2006, n'est donc qu'un exemple, d'accès très simple, des services à base de connaissances offert par l'architecture.

Notons pour conclure que le sujet de « l'e-science » intéresse particulièrement Microsoft : la conception d'outils logiciels pour l'analyse des données scientifiques complexes est un des sujets du laboratoire de recherche commun de Microsoft et de l'INRIA récemment inauguré à Orsay ; que l'information sur la santé et les services de santé, devenu intimement liée au Web, devient un enjeu commercial et technique de la concurrence entre les grands acteurs de l'Internet, Google et Microsoft en tête ; et qu'enfin, l'architecture technique a une portée qui s'étend bien au-delà du seul domaine de la santé. On a probablement pas fini d'entendre parler de l'architecture Medstory.

Alors faire gagner 2 cents à l'action de Microsoft au NASDAQ, chapeau bas pour un ancien de Janson...

ShareThis