Transformation d'annotations en parties du discours et lemmes vers le format Universal Dependencies : étude de cas pour l'alsacien et l'occitan (Converting POS-tag and Lemma Annotations into the Universal Dependencies Format : A Case Study on Alsatian and Occitan )

Type de ressource
Conference Paper
Auteurs/contributeurs
Title
Transformation d'annotations en parties du discours et lemmes vers le format Universal Dependencies : étude de cas pour l'alsacien et l'occitan (Converting POS-tag and Lemma Annotations into the Universal Dependencies Format : A Case Study on Alsatian and Occitan )
Abstract
Cet article présente un retour d'expérience sur la transformation de corpus annotés pour l'alsacien et l'occitan vers le format CONLL-U défini dans le projet Universal Dependencies. Il met en particulier l'accent sur divers points de vigilance à prendre en compte, concernant la tokénisation et la définition des catégories pour l'annotation.
Date
2019-07
Proceedings Title
Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume II : Articles courts
Conference Name
JEP/TALN/RECITAL 2019
Place
Toulouse, France
Publisher
ATALA
Pages
427–436
Language
French
Short Title
Transformation d'annotations en parties du discours et lemmes vers le format Universal Dependencies
Accessed
08/11/2024 13:55
Library Catalog
ACLWeb
Référence
Miletić, A., Bernhard, D., Bras, M., Ligozat, A.-L., & Vergez-Couret, M. (2019). Transformation d’annotations en parties du discours et lemmes vers le format Universal Dependencies : étude de cas pour l’alsacien et l’occitan (Converting POS-tag and Lemma Annotations into the Universal Dependencies Format : A Case Study on Alsatian and Occitan ). In E. Morin, S. Rosset, & P. Zweigenbaum (Eds.), Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) PFIA 2019. Volume II : Articles courts (pp. 427–436). ATALA. https://aclanthology.org/2019.jeptalnrecital-court.29
Langue