Sabine Carbonnel

Ingénieur de recherche, informatique (Ecole des mines d'Albi Carmaux)

31ToulouseMidi-Pyrénées - France

Docteur en informatique de l'INSA de Rennes.

J'ai effectué mon doctorat à l'IRISA au sein de l'équipe IMADOC. Je m'intéresse à l'IHM et à l'intelligence artificielle. Mes recherches ont porté sur la reconnaissance d'écriture manuscrite et plus particulièrement sur l'intégration de connaissances linguistiques pour guider la reconnaissance.

J'ai également enseigné à l'INSA et à l'université de Rennes 1, avec un intérêt fort pour le génie logiciel.

Après un postdoc à l'IRIT (Toulouse) dans l'équipe SIG (Systèmes d'Informations Généralisées), je suis maintenant ingénieur de recherche dans le centre de recherche en génie industriel de l'école des mines d'Albi Carmaux.

Sabine Carbonnel
18 contacts
Expérience professionnelle
2005 - 2006

J'ai été ATER (attaché temporaire à l'enseignement et à la recherche) à l'IRISA, qui est un institut de recherche en informatique et j'ai enseigné à l'université de Rennes 1 (intérêt fort pour le génie logiciel). J'ai effectué un doctorat dans l'équipe IMADOC et j'ai poursuivi mes recherches sur l'intégration de connaissances linguistiques pour la reconnaissance d'écriture manuscrite. J'ai collaboré notamment à des travaux connexes aux miens sur l’indexation et la recherche de documents anciens et sur la reconnaissance de textes manuscrits.

Universités et grandes écoles
2002 - 2005

L'IRISA est un institut de recherche en informatique, unité mixte de recherche regroupant, l'INRIA, le CNRS, l'université de Rennes 1 et l'INSA de Rennes. J'ai effectué mon doctorat dans l'équipe IMADOC dont les thèmes de recherche concernent l'analyse automatique de documents, la reconnaissance d'écriture manuscrite et l'étude des interactions stylo sur un document électronique. Mes travaux ont concerné l'introduction de connaissances linguistiques pour la reconnaissance d'écriture manuscrite. En parallèle de ces activités de recherche j'ai enseigné à l'INSA de Rennes dans le cadre du monitorat de l'enseignement supérieur (CIES).

Résumé de thèse :
Le cadre de ma thèse est la reconnaissance d’écriture manuscrite. Elle porte sur l’intégration de connaissances lexicales en vue d’améliorer la reconnaissance de mots manuscrits en-ligne. Le système de reconnaissance développé dans l’équipe IMADOC et dans lequel s’intègrent mes travaux est basé sur une approche analytique, c’est-à-dire un découpage des mots en lettres. Ceci engendre des ambiguïtés de reconnaissance souvent dues à des difficultés de segmentation correcte des mots en lettres. Des connaissances lexicales sont indispensables pour guider le système de reconnaissance et proposer des réponses lexicalement correctes. Nous proposons un traitement lexical en trois étapes basé sur des connaissances issues d’un lexique et sur une distance d’édition. Ce traitement opère à deux niveaux du système de reconnaissance : pendant la phase de reconnaissance (1ère étape) qui génère un ensemble de propositions de reconnaissances traitées ensuite dans la phase dite de post-traitement (2e et 3e étapes). La 1ère étape de ce traitement lexical est l’intégration d’un modèle de langage de n-grammes de caractères au système RESIFMot. L’intérêt de cette étape est d’améliorer la cohérence linguistique des propositions de reconnaissance.
Les 2e et 3e étapes permettent de rechercher dans un lexique les mots les plus proches des propositions de reconnaissance du système à l’aide d’une distance d’édition dans le but de lever certaines ambiguïtés du système.
La 2e étape correspond à une réduction du lexique (vocabulaire large : supérieur à 10000 mots) pour diminuer l’espace des recherches. Les modélisations du dictionnaire que nous proposons permettant de réduire très fortement la durée du post-traitement lexical mais également d’améliorer la reconnaissance.
La 3e étape est la correction lexicale des propositions de reconnaissance d’après le lexique réduit et une distance d’édition spécifique à la correction des ambiguïtés de reconnaissance et de segmentation de mots. Généralement, les paramètres de ce genre de distance (opérations d’édition et coûts associés) sont définis empiriquement, ce qui est assez difficile à réaliser. Nous avons développé pour cela une méthode d’apprentissage automatique des opérations d’édition et de leurs coûts basée sur les techniques de boosting2. L’avantage de cet
apprentissage est de pouvoir adapter automatiquement le post-traitement lexical aux évolutions du système de reconnaissance et à différents contextes d’utilisation.

Universités et grandes écoles
Ancien élève de
Hobbies
Montagne , Et , Escalade

Les visiteurs de ce profil ont aussi consulté
Jean Bort
Gérant, Nexsen Bike
Joanna Moulierac
Enseignant Chercheur, IUT de Nice, département informatique
Fabien Ric
Consultant Technologie & Architecture, Capgemini Application Services
Olivier Barais
Maître de conférence, Université Rennes1 / INRIA Projet Triskell
Alexandre Guitton
Maître de conférences en informatique, Université Blaise Pascal
Pascale HUBER
Ingénieur Conseil - Département Risques Professionnels de la Sécurité Sociale
Virginie ALMONACIL
Consultante métier, Capgemini - UPMC
Adrien Boulard
Etudiant, ENSICAEN
AIT TIGHJDIN FATIHA
Conductrice de ligne-régleuse , URGO
Laurent Morisset
Chauffeur, Morisset
Viadeo pour votre carrière : Créez votre profil