À propos de moi

Je suis doctorant en informatique à Sorbonne Université et à l’équipe de recherche ALMAnaCH à Inria Paris. Je travaille en Traitement Automatique du Langage Naturel (TALN) pour les langues historiques.

Je m’intéresse aux grands corpus pour l’entraînement de modèles de langue, en particulier pour les langues peu-dotées et les langues historiques. Je suis intéressé par des tâches telles que la reconnaissance d’entités nommées (NER), l’analyse syntaxique, l’étiquetage morpho-syntaxique, la traduction automatique et la structuration de documents.

J’adore le café, les cookies et les maths.

Intérêts
  • Modèles de langue
  • linguistique de corpus
  • Reconnaissance d’entités nommées
  • Traduction automatique
  • Linguistique computationnelle
Formation
  • Doctorat en Informatique

    Sorbonne Université

  • Licence MIASHS, 2018

    Université Paris 8

  • Master en Mathématiques, 2017

    Aix-Marseille Université

  • Licence en Mathématiques, 2016

    Universidad Nacional de Colombia

Publications récentes

Projets

*
BASNUM

BASNUM

Digitization and analysis of Basnage de Beauval’s Universal Dictionary: lexicography and scientific networks

CamemBERT

CamemBERT

A state-of-the-art language model for French.

OSCAR

OSCAR

OSCAR or Open Super-large Crawled Aggregated coRpus is a huge multilingual corpus

Contactez moi