Menu

Jean Leon BOURAOUI

Paris

En résumé

Spécialisé dans tous les domaines du Traitement Automatique du Langage Naturel (TALN ) aussi bien à l'écrit qu'à l'oral, et dans le contexte de la Recherche d'Information.

Spécialisations :Traitement Automatique du Langage Naturel (TALN), Corpus, Recherche d'Information, Développement, Recherche, Web Sémantique, Apprentissage automatique, Text et Data Mining

Mes compétences :
Recherche
Informatique
Enseignement
Information Retrieval
Machine Learning
Text mining
Traitement automatique du language
Python
Lucene

Entreprises

  • Orange - Ingénieur de Recherche

    Paris 2014 - maintenant
  • Prometil - Responsable de Projets R&D

    Toulouse 2012 - 2014 En résumé: Mise en place d'un département R&D à Prometil: valorisation et co-développement d'un module de Traitement Automatique du Langage, initialement conçu et développé à l’Institut de Recherche en Informatique de Toulouse (IRIT).

    En détails: dans ce contexte, le moteur de Traitement Automatique du Langage est utilisé pour deux applications: analyse automatique des opinions ("opinion/sentiment mining") et analyse automatique des textes d'exigences (spécifications).
    - Analyse automatique des opinions: nous avons mis en place un système permettant de noter automatiquement les opinions exprimées sur différents attributs d'un domaine: par exemple les attributs "confort", "accueil", etc. pour les avis sur des hôtels.
    - Analyse automatique des textes d'exigences: notre outil permet d'alerter le rédacteur d'exigences sur des problèmes dans son contenu (par exemple: des termes difficiles à interpréter, des phrases trop complexes à utiliser, etc. Plus plus de détails, cf. http://www.prometil.com/fr/lelie

    Autres tâches effectuées:
    - Coordination avec les équipes commerciales de développement
    - Présentations et séminaires
    - Participation au montage de projets pour financer ces travaux (CIR, RAPID, OSEO, etc.)
    - Recherche de nouvelles collaborations
  • Ministère de l'Enseignement Supérieur et de la Recherche - Expert externe Crédit Impôt Recherche (CIR)

    Paris 2011 - 2012 En parallèle de mon travail principal à l'Université Catholique de Louvain, missions ponctuelles d'expertise externe sur l'éligibilité d'entreprises au Crédit Impôt Recherche (CIR), pour deux demandes de rescrits Jeune Entreprise Innovante (JEI) et un contrôle de déclaration de CIR.
  • Université Catholique de Louvain - Ingénieur Recherche et Développement

    2010 - 2012 En résumé: conception, développement, et évaluation de nouvelles fonctionnalités pour une plateforme Web de recherche et aggrégation automatique d’informations biographiques : désambiguïsation d’Entités Nommées, expansion de requêtes.
    Cette activité (post doc) se situe dans le cadre d'un projet européen (Biographe), conjoint à la création de Knowbel, spin-off de mon laboratoire d'accueil (Cental).

    Description détaillée:
    Dans le contexte général du projet Biographe, j'ai travaillé sur deux des problématiques liées à la plate forme, pour le français et l'anglais.
    La première est la possibilité de déterminer automatiquement à qui réfère un nom, en cas d’ambigüité de celui-ci (par exemple, 6 "Jacques Martin" différents répertoriés sur Wikipédia en français).
    La seconde est l'expansion de requêtes appliquée à des noms de profession (par exemple: proposer le mot "programmeur" pour la requête "développeur").

    Ressources utilisées:
    - Désambiguisation des Entités Nommées: DBpedia
    - Expansion de requêtes: Code ROME des métiers (et son équivalent anglais)

    Techniques utilisées:
    - Désambiguisation des Entités Nommées: vectorisation des textes cibles, et utilisation de la similarité Cosine
    - Expansion de requêtes: exploitation du code ROME comme un réseau hiérarchique de concepts et de termes

    Autres tâches effectuées:
    - État de l'art
    - Rédaction de livrables
    - Participation aux différentes réunions de coordination du projet en Europe (consortium de 4 entreprises, 2 universités, de 4 pays différents)
  • Orange Labs (France Telecom R&D) - Ingénieur en Recherche et Développement

    Paris 2008 - 2010 En résumé: Conception, développement, et évaluation d’un système d’expansion sémantique de requêtes, à partir des ressources linguistiques et informatiques disponibles à Orange Labs (dans le cadre d'un post doc).

    Description détaillée:
    L'expansion sémantique de requête est liée à l'utilisation d'un moteur de recherche: elle permet de proposer à l'utilisateur des termes proches de sa requête initiale, afin d'augmenter le nombre de documents pertinents trouvés (par exemple: la requête "voiture" pourra être augmentée par "automobile".

    Ressources utilisées:
    - Thesaurus interne à Orange
    - Réseau de type "treillis de Gallois", constitué à Orange, et utilisant Wikipédia

    Applications:
    - Moteur de recherche interne à Orange
    - Prototype de recommandation de contenu vidéos
    - Prototype de moteur de recherche multilingue

    Autres tâches effectuées:
    - État de l'art
    - Rédaction de livrables
  • Université de Pau et des Pays de l'Adour - Attaché Temporaire à l'Enseignement et la Recherche

    2007 - 2008 Cours sur les thèmes suivants:

    - Développement d'Applications Internet (HTML, XML, Javascript, Ajax)
    - Programmation Orientée Objet
    - Algorithmique
    - Bureautique (Microsoft Office et Open Office)
  • Université Paul Sabatier - Attaché Temporaire à l'Enseignement et la Recherche

    Toulouse 2006 - 2007 Cours sur les thèmes suivants:

    - Réseaux
    - Développement de sites Web
    - Bureautique et Tableur avancé
  • Institut de Recherche en Informatique de Toulouse - Ingénieur d'Etude

    2001 - 2003 - Développement et évaluation d'un modèle de langage de dialogues oraux spontanés (Modèles de Markov Cachés)
    - Transcription, annotation, et analyse de corpus audio (dialogues de Contrôle Aérien), pour l’étude des inattendus de l’oral (disfluences) : début de ma thèse

Formations

Réseau

Annuaire des membres :