Des données aux connaissances : un long chemin pour enrichir les mémoires
Des données sont disponibles en quantité importante et en qualité variable, sans qu’il en existe une utilisation particulière a priori. Une question fondamentale est de savoir comment extraire, à partir de ces grandes masses, des connaissances utiles à l’homme et la machine (les mémoires). Une question parallèle est d’être capable de manipuler les documents de toute
nature maintenant accessibles sur le Web en fonction de leur contenu. Ce sont là des problématiques qui relèvent du processus de découverte (ou extraction) de connaissances dans des masses de données. Un tel processus nécessite une préparation puis une fouille des données et, ensuite, une interprétation et une représentation des éléments extraits pour réutilisation. La découverte est itérative et interactive, et doit s’appuyer sur des connaissances du domaine des données. Ainsi, découverte et représentation des connaissances sont deux processus complémentaires – pas de fouille sans modèle – qui sont à la base de la conception de systèmes intelligents.
Amedeo Napoli est directeur de recherches au CNRS et responsable scientifique de l’équipe Orpailleur au LORIA/Inria Nancy. Il est spécialiste des méthodes symboliques de découverte de connaissances dans les bases de données, comme l’analyse formelle de concepts et ses dérivés. Il travaille aussi sur les formalismes de représentation des connaissances et de raisonnement, ainsi que sur la conception d’ontologies pour le Web sémantique. Enfin, il participe à de nombreux projets nationaux et internationaux où il met en oeuvre recherches et applications, notamment en sciences de la vie.
Répliques art-science : jeudi 13 juin