Votre recherche
Résultats 4 ressources
-
Cet article présente un retour d'expérience sur la transformation de corpus annotés pour l'alsacien et l'occitan vers le format CONLL-U défini dans le projet Universal Dependencies. Il met en particulier l'accent sur divers points de vigilance à prendre en compte, concernant la tokénisation et la définition des catégories pour l'annotation.
-
This article describes the creation of corpora with part-of-speech annotations for three regional languages of France: Alsatian, Occitan and Picard. These manual annotations were performed in the context of the RESTAURE project, whose goal is to develop resources and tools for these under-resourced French regional languages. The article presents the tagsets used in the annotation process as well as the resulting annotated corpora.
Explorer
Corpus
-
Texte
(2)
-
Annotated
(1)
- Morphology (1)
-
Annotated
(1)
Langue
- Alsacien (1)
-
Multilingue
(1)
- Langues COLaF (1)
- Occitan (2)
- Picard (1)
Tâche
Type de papier
- Projet (1)