Objectif

L’extraction de connaissances à partir de grands ensembles de données représente un domaine très actif dans la communauté informatique. Les algorithmes sous-jacents sont caractérisés essentiellement par le niveau de complexité des ensembles de données manipulées, la source de ces données et les types de connaissances générées. Dans le cadre précis des entrepôts de données, ces derniers comportent des données de types simple monovalué : numérique, qualitatif, binaire, etc. provenant de différents milieux (industriel, économique, social, médical, etc.) ou de mesures réelles, et renferment une quantité importante de connaissances cachées extraites par des algorithmes d’extraction de connaissances.
Ces algorithmes avérés performants sur ces données de type simple, présentent cependant des limites lorsqu’ils sont déployés sur des ensembles de données complexes, de sources très hétérogènes et visant des connaissances de différents niveaux de granularité.
L’objectif de ce projet est de dresser des pistes d’investigation permettant de lever cette limite et ce, selon deux axes principaux et complémentaires.
Le premier axe vise à mener une réflexion globale centrée sur deux fronts:
  1. la structuration et la représentation formelle des objets complexes,
  2. la définition d’algorithmes d’extraction des connaissances qui y sont enfouies pour atteindre diverses spécifications de connaissances.
Le deuxième axe porte sur la caractérisation des sources d’objets complexes manipulés dans le cadre du premier axe. Compte tenu de la diversité de ces sources d’une part, et de la prolifération de l’usage du web tant dans les applications industrielles qu’académiques d’autre part, nous faisons un premier choix de nous orienter à juste titre vers la ressource web. Cette caractérisation passe par la définition de diverses dimensions nous permettant de clarifier cette source. Nous effectuons alors un deuxième choix justifié par les expertises des équipes participantes au projet, d’aller vers l’enrichissement de cette source par la sémantique et le contexte social, dans le cadre précis d’un applicatif qui est en l’occurrence la recherche de l’information. Ce projet de coopération vise à consolider une synergie qui s’est établie entre un groupe de chercheurs tunisiens et français, et qui vise à fédérer ces groupes de chercheurs travaillant ou intéressées par cette problématique pour partager leurs expériences et expertises et promouvoir ce domaine en forte croissance.
Nous souhaitons à travers ce projet faire émerger un pôle franco-tunisien important et fort en ingénierie de connaissances et en fouille de données complexes.

Comments are closed.