Reunion
ÉXPOSÉS
Quatre exposés ont été présentés pendant la réunion qui s’est déroulé du 26 novembre au 28 novembre 2012:
1. Éxposé présenté par Nader Jelassi
Titre : Utilisation du profil de l’utilisateur pour une recommandation personnalisée dans les folksonomies (Télécharger)
Résumé:
Les utilisateurs sont les principaux acteurs d’une folksonomie puisqu’ils sont à la fois les créateurs et contributeurs du contenu. Cependant, les profils des utilisateurs diffèrent; chacun correspondant à un vocabulaire et des centres d’intérêts précis. Cependant, les systèmes de recommandation tiennent peu en compte le profil de l’utilisateur lorsqu’il lui suggère une liste de tags ou de ressources ou même une liste d’amis. Dans cet exposé, nous considérons le profil de l’utilisateur comme quatrième dimension d’une folksonomie, classiquement composée de trois dimensions (utilisateurs, tags et ressources) et nous proposons une approche quadratique afin de regrouper les utilisateurs au profil et intérêts similaires. Notre approche est basée sur une extension de l’algorithme TriCons pour permettre l’extraction des concepts quadratiques. Par suite, nous utilisons ces concepts pour une recommandation personnalisée de tags, de ressources ou d’amis qui est mieux appropriée pour le profil de l’utilisateur ciblé. Les expérimentations sont menées sur le dataset de filmographie MovieLens.
2. Éxposé présenté par Bilel Moulahi
Titre : L’intégrale de Choquet pour l’agrégation de pertinence (Télécharger)
Résumé :
L’agrégation multicritère est une issue qui a été largement abordée dans de nombreux problèmes de prise de décision. Nous nous intéressons à étudier ce problème dans le domaine de recherche d’information. Nous proposons une nouvelle approche basée sur l’intégrale de Choquet discrète pour l’agrégation de pertinence multicritère. Outre sa sa prise en compte des éventuelles interactions pouvant exister entre l’ensemble de critères de pertinence, cet opérateur d’agrégation permet de modéliser toutes les préférences des utilisateurs. Nous avons étudié l’efficacité de notre modèle dans un contexte de recherche d’information sociale, en particulier, dans la recherche de tweets. Les études menées sur la collection Trec Microblog 2011 montrent l’efficacité de notre approche.
3. Éxposé présenté par Dhouha Grissa
Titre : Etude des mesures d’intérêt de motifs complexes: une extension à la sélection de méta-connaissances (Télécharger)
Résumé:
La recherche de règles d’association intéressantes est un domaine de recherche important et actif en fouille de données. Les algorithmes de la famille Apriori reposent sur deux mesures pour extraire les règles, le support et la confiance. Bien que ces deux mesures possèdent des vertus algorithmiques accélératrices, elles génèrent un nombre prohibitif de règles dont la plupart sont redondantes et sans intérêt.Il est donc nécessaire de disposer d’autres mesures filtrant les règles inintéressantes. Notre travail consiste à synthétiser les différents travaux réalisés pour dégager les propriétés des mesures d’extraction des règles afin de retenir celles qui sont intéressantes pour l’utilisateur. Toutes ces propriétés sont ensuite évaluées sur une soixantaine de mesures, étendant de manière significative les précédents travaux de la littérature. Cette synthèse a été le point de départ pour une catégorisation des mesures afin d’aider l’utilisateur dans le choix de ses mesures. Deux méthodes ont été utilisées: la première méthode consiste à appliquer les deux techniques de classification non supervisée (CAH et k-moyennes) et la deuxième méthode choisie est l’analyse factorielle des données binaires, que nous l’avons appliquée sur la matrice d’évaluation des mesures selon les propriétés.
4. Éxposé présenté par Cyrine Nasri
Titre : Extraction des séquences inter-langue pour la traduction automatique (Télécharger)
Résumé:
Les systèmes de traduction actuels se basent toujours sur un modèle de traduction à base d’alignements fondés initialement sur les mots.Dans notre travail, nous proposons une nouvelle approche de traduction automatique statistique à base de séquences qui n’utilisent d’alignements entre les mots. Notre approche est basée sur les triggers inter-langues déterminés en utilisant la métrique statistique Information Mutuelle Multi-variables. Cet algorithme segmente les phrases sources en des séquences de mots et détermine simultanément leurs traductions en langue cible. L’objectif principal est de construire directement des alignements valides entre les séquences en langue source et cible.En dépit, de l’originalité de notre méthode, des expérimentations ont montré que les résultats sont compétitifs, mais a besoin d’autres améliorations afin de surmonter les approches de l’état de l’art.
SÉMINAIRE
Lors de la réunion un séminaire des 3 séniors français a eu lieu pour les étudiants de Master Informatique :
Lundi 27 novembre 2012, 15h-17h – Engelbert Mephu Nguifo : Apprentissage artificiel, que savoir ?
Mardi 28 novembre 2012, 9h-11h – Anne Laurent : Motifs graduels, un état de l’art.
Mardi 28 novembre 2012, 14h-17h -Lynda Tamine-Lechani : Réseaux sociaux et recherche d’information.