Menu

Frédéric BLAIN

SHEFFIELD

En résumé

Researcher in MT field, my research interests lie at specializing on user feedback analysis, post-editing of machine translation hypothesis, and incremental adaptation (domain, project) of a statistical MT system.

I previously worked at MateCat as a postdoctoral MT researcher.

Mes compétences :
OOP
Information retrieval
C/C++
XML/XSLT
VIM
Ruby
Perl
Pattern recognition
Machine Translation
Computational Linguistics
Shell scripting
Natural language processing
Machine Learning
GNU/Linux
GIT
SVN
R&D and Technological Innovations
Informatique

Entreprises

  • University of Sheffield - Research Associate in Machine Translation

    2015 - maintenant
  • Laboratoire Informatique Université du Maine - Postdoctoral researcher

    2013 - 2014
  • Laboratoire Informatique Université du Maine - PhD student

    2009 - 2013 Axes de recherche :

    1. Évolution dans le temps
    Un système de traduction statistique développé avec des ressources disponibles à un instant t peut devenir moins approprié avec le temps. Ainsi, il est étudié dans cette thèse de nouvelles méthodes pour d'abord détecter que l'environnement a changé, nécessitant une évolution du système. Il est facile de déterminer qu'un nouveau mot n'est pas connu par le système, mais les techniques actuelles ne permettent pas d'en déduire automatiquement une traduction.

    2. Évolution du système liée aux utilisateurs
    Le deuxième axe de recherche concerne l'évolution du système en fonction des retours par l'utilisateur.
    Il s'agit donc d'utiliser ces informations pour faire évoluer les systèmes de traduction. Ceci inclut premièrement une analyse de la correction: est-ce qu'elle concerne la terminologie, une correction grammaticale, une ré-organisation de la phrase, ... ? Cette analyse sera basée sur des ressources linguistiques d'analyse des techniques statistiques. Il faudra également évaluer la qualité des corrections effectuées par l'utilisateur. On essayera par exemple d'éviter qu'une fausse correction, mal-intentionnée ou pas, puisse perturber les performances du système.
    Ensuite, il s'agira de développer des techniques pour effectuer la mise à jour des paramètres des systèmes sans effectuer un cycle d'apprentissage complet (ce qui demanderait trop de temps).

    - Implication dans des conventions de recherche (ANR, pôles de compétitivité,....)

    Je suis membre de l'équipe scientifique en charge du projet COSMAT qui est un projet financé en totalité par l'ANR. Lancé à la mi-octobre 2009, ce projet à pour objectif d'offrir la possibilité de faire traduire les articles scientifiques du serveur « HAL » entre le français et l'anglais.
    Informations supplémentaires sur le site du projet dont je suis également administrateur : www.cosmat.fr.

    Je participe également aux projets QUAERO et MateCat.
  • SYSTRAN SA - Ingénieur de Recherche / Doctorant en Informatique

    Paris 2009 - 2012
  • Systran - Ingénieur de recherche - stagiaire

    Paris 2009 - 2009 Constitution de ressources bilingues à partir de corpus dits "comparables"

    Après un état de l'art des techniques d'acquisition de ressources bilingues à partir de corpus comparables, les axes suivants ont été explorés:
    – Alignement au niveau de la phrase basé sur des similarités entre des traductions automatiques et les traductions existantes;
    – Alignement sous-phrastique basé sur des motifs linguistiques complétés par une analyse de confiance d’alignement statistique;
    – Utilisation de l’historique des documents et des informations propres à Wikipédia concernant les requêtes de traduction.
    Il a ainsi été procédé à la constitution de ressources bilingues pour les paires de langue fr-en et en-fr en utilisant le corpus médical de l'encyclopédie Wikipédia.
    Il a également été démontré l'apport du corpus bilingue constitué dans l'entraînement d'un modèle SPE. La qualité des traductions (évaluation en score BLEU) ayant été améliorée après réalisation d'une post-edition statistique.
  • NXP Semiconductors - Administrateur système - stagiaire

    Colombelles 2008 - 2008 Migration de l’Intranet de NXP Le Mans de Solaris à GNU/Linux.

    Un des objectifs de la migration était de pouvoir libérer le serveur intranet pour cette application dont la consommation en ressources était devenue trop importante.
    Cette migration sur un serveur Linux a nécessité une étude préalable de l’architecture du serveur intranet alors en activité, ainsi qu'une cartographie des applications et des services devant être migrés. C'en est suivie la préparation des serveurs applicatifs (Apache2, MySQL et Tomcat) et la migration des applications (PHP, PERL, Java).

    - Optimisation du moteur de l’application de gestion documentaire, suite à la migration du serveur intranet.

    L’application web de gestion documentaire, alors accessible via le portail Intranet de la société, est fortement utilisée par les équipes de développement. L'optimisation du moteur de cette application, entièrement codé en PERL, fut consécutive à l’upgrade du serveur httpd (et de son mode PERL).
  • S.A.R.L. Tripall - Développeur WinDev - stagiaire

    2007 - 2007 Développement d’une application de gestion d’activités d’un tour-opérateur

    Développement des modules de mise à jour des sites internet, des modules de récupération des informations collectées par ces sites web, ainsi que les modules de transferts de données entres les différents sites du client.
    Outre la prise en compte des technologies utilisées par les sites concernés, le développement se fait avec WinDev 8. Une attention particulière fut portée à l’ergonomie et à la convivialité de l’interface, compte tenu des différents publics visés.
  • Faculté de Sciences et Techniques, Université du Maine, Le Mans - Tuteur / Formateur

    2006 - 2007 TuTorat qualifiant pour le C2i

    Poste contractualisé de tuteur qualifié à l'Université du Maine dans le cadre de la préparation au C2i (Certificat Informatique & Internet), niveau 1, des étudiants en première année de licence.
  • Ouest France - Correspondant local de presse

    Rennes 2006 - 2009 Relayer l'actualité rurale dans la presse écrite locale pour le compte d'associations, de collectivités ou de particuliers se distinguant par leurs actions au quotidien.

    [Activité réalisée parallèlement à la poursuite de mes études universitaires.]

Formations

  • Ecole Doctorale Sciences Et Technologies De L'Information, Mathématiques (Le Mans)

    Le Mans 2009 - 2013 Doctorat Informatique

    Traduction Automatique - Thèse CIFRE-Défense financée en partie par la DGA/Ministère de la Défense.
    Sujet : "Modèle de traduction évolutif"
    Encadrement scientifique :
    - Directeur de thèse : Pr. Holger Schwenk (LIUM)
    - Co-encadrant : Dr. Jean Senellart (Systran)
  • Université Du Maine (Le Mans)

    Le Mans 2008 - 2009
  • Université Du Maine

    Le Mans 2004 - 2009 Licence & Master Recherche en Informatique
  • Lycée Notre Dame De Sainte Croix

    Le Mans 2001 - 2004 Science & Technique Industrielle - Génie Electroniqe

    génie électronique

Réseau

Annuaire des membres :