Menu

Thomas PALFRAY

PARIS

En résumé

Passionné par le document, je travaille depuis 2007 à améliorer mon expertise des méthodes d'analyses automatiques permettant de valoriser les corpus documentaires, qu'ils soient originaires du monde culturel ou de celui de l'entreprise.

Après avoir passé 5 ans dans un laboratoire de recherche universitaire (LITIS) au sein d'une équipe spécialisée dans l'apprentissage statistique et les méthodes d'analyses du document par l'image, j'ai rejoint début 2013 l'équipe Recherche et Développement du groupe NUMEN où je travaille sur des problématiques de traitement automatique de la langue afin d'améliorer la qualité du texte produit par les OCR.

J'apporte aussi mon expertise sur les questions relatives à l'ensemble des problématiques de Recherche & Développement identifiées au sein du groupe Numen.

Mes compétences :
Java/j2ee
C++
Opencv
Traitement d'images
Traitement automatique des langues
Traitement du signal
Reconnaissance Automatique de Documents
OCR
Classification de Documents
Lecture Automatique de Documents

Entreprises

  • NUMEN - Responsable Recherche et Développement

    PARIS 2014 - maintenant J'exerce une fonction transverse à l'ensemble des Business Units du groupe Numen.

    Les objectifs sont, entres autres :
    - L'analyse des besoins des Business Units afin d'identifier de nouvelles thématiques de R&D,
    - La mise en place de projets concrétisant ces thématiques et leur pilotage,
    - La dissémination des savoirs acquis au sein de l'ensemble de l'ingénierie du groupe,
    - La formation des commerciaux et avant vente à ces nouvelles technologies.

    Les thématiques de recherche étudiées couvrent l'ensemble des métiers du groupe Numen.
  • NUMEN - Ingénieur Recherche et Développement

    PARIS 2013 - 2014 Intégré au sein du pôle Recherche et Développement de Numen Digital, entitée du groupe Numen, je travaille sur le Projet d'Amélioration de la Capture TExtuelle (PACTE), ou je met en oeuvre des techniques de Traitement Automatique de la Langue pour améliorer la qualité du texte en sortie d'un système d'OCR. Je m'occupe de la coordination et de l'animation du projet avec l'ensemble des partenaires du consortium PACTE.

    Je suis également responsable de la conception de l'architecture des chaînes de production de données en qualité éditoriale (>99.999%), ainsi que de leur déploiement en collaboration avec nos équipes d'ingénieurs offshore situées à Madagascar.
  • LITIS - Ingénieur Recherche et Développement

    2007 - 2012 Projet "Plateforme d'Indexation Régionale" (PlaIR)

    Contexte : Au sein de l'équipe Documents et apprentissage, je participe à un projet de valorisation du "Journal de Rouen", quotidien paru entre 1762 et 1947 et conservé aux Archives de Seine Maritime.

    Réalisations :
    - Production d'outils d'analyse automatique de ces documents pour en extraire la structure physique et logique, c'est à dire la mise en page, mais aussi le texte et les illustrations (C/C++).
    - Génération des métadonnées associées à ces documents à partir des informations extraites (ALTO, METS, EAD).
    - Production d'un moteur de recherche et de consultation de journaux en ligne (JAVA/J2EE), visible sur http://plair.univ-rouen.fr

    Lien : http://www.plair.org


    Projet "Outils Pour le Traitement Informatique des Manuscrits d'Auteurs" (OPTIMA)

    Contexte : Au sein de l'équipe Documents et apprentissage, je participe à un projet ANR visant à créer de nouveaux outils pour l'exploitation de brouillons d'auteurs en partenariat avec l'Institut des Textes et Manuscrits Modernes (ITEM) ainsi que le laboratoire d'Informatique de Paris Nord (LIPN) et la bibliothèque nationale de France.

    Réalisations :
    - Production d'un nouveau langage XML capable de stocker toutes les informations sur le positionnement physique des données issues d'un brouillon.
    - Création d'un logiciel d'annotation de brouillons d'auteur capable de saisir des transcriptions dites "ultra-diplomatique" (JAVA).
    - Création d'un moteur de rendu temps réel capable de générer un visuel SVG à partir des informations contenus dans les fichiers de transcription (JAVA).

    Lien : http://www.item.ens.fr/index.php?id=14059
  • CARDIWEB - Ingénieur intégration (stage de fin d'études)

    Paris 2007 - 2007 SSII spécialisée dans le développement de solutions e-business basée sur les
    technologies J2EE. Stage de fin d’études de 6 mois en tant qu’ingénieur en intégration sur plusieurs projets d'envergure (extranet Fond de Réserve des Retraites, plateforme B2B Donatello ...)

Formations

  • Université Rouen Haute Normandie IGIS

    Rouen 2004 - 2007 Génie Electrique et Informatique Industrielle (Parcours IUP)
  • Université Le Havre (Le Havre)

    Le Havre 2002 - 2004 Génie Electrique et Informatique Industrielle (option Réseaux Locaux Industriels)
  • Université Le Havre (Le Havre)

    Le Havre 2002 - 2004 Réseaux Locaux Industriels
  • Université Le Havre (Le Havre)

    Le Havre 2001 - 2002 Mathématiques et Informatiques Appliqués aux Sciences (MIAS)

Réseau

Annuaire des membres :