Résultats | Bibliographie COLaF

Bernhard, D., Ligozat, A.-L., Bras, M., Martin, F., Vergez-Couret, M., Erhart, P., Sibille, J., Todirascu, A., Boula de Mareüil, P., & Huck, D. (2021). Collecting and annotating corpora for three under-resourced languages of France: Methodological issues. Language Documentation & Conservation, 15, 316–357. https://hal.science/hal-03273196

Consulter sur hal.science

Bernhard, D. (2019, November). Natural language processing for regional languages of France: Lessons learned from the RESTAURE project. New Ways of Analyzing Dialectal Variation. https://hal.science/hal-01297835

Consulter sur hal.science

Amalia, T. (2018). Tokeniser for Picard (Version version 1.0). Zenodo. https://doi.org/10.5281/zenodo.1493642

This software is developed for the tokenisation of Picard texts, e.g. splitting sentences into words and ponctuation signs. The tokeniser handles ambiguous separators such as dash, apostrophe, dot. The software is developed in Perl 5.22.1. The installation and the running issues are explained in the script file.

Consulter sur zenodo.org

Bernhard, D., Todirascu, A., Martin, F., Erhart, P., Steiblé, L., Huck, D., & Rey, C. (2017). Problèmes de tokénisation pour deux langues régionales de France, l’alsacien et le picard. DiLiTAL 2017, 14–23. https://hal.science/hal-01539160

La tokénisation est une étape essentielle dans tout système de traitement automatique des langues, d’autant plus que de nombreux outils dépendent du découpage obtenu. La tâche est particulièrement ardue pour les textes qui ne respectent pas les conventions orthotypographiques ou les langues pour lesquelles ces conventions ne sont pas stabilisées. Nous nous intéressons ici aux cas de deux langues régionales de France, l’alsacien et le picard. Nous présentons les défis posés par ces deux langues, et proposons des critères de découpage implémentés dans des tokéniseurs.

Consulter le document

Eloy, J.-M., Martin, F., & Rey, C. (2015, June). PICARTEXT : Une ressource informatisée pour la langue picarde. Proceedings of TALaRE 2015 - Traitement Automatique des Langues Regionales de France et d’Europe. https://hal.science/hal-01366138

Consulter sur hal.science

Bernhard, D., & Vergez-Couret, M. (2015). Le projet RESTAURE. Colloque Sur Les Technologies Pour Les Langues Régionales de France (TLRF 2015), 96–100. https://hal.science/hal-01297835

Consulter sur hal.science

Dawson, A. (2004). « L’patois s’apprind tout seu »: les pièges de l’enseignement du picard. Éla. Études de linguistique appliquée, 136(4), 487–498. https://doi.org/10.3917/ela.136.0487

Le picard apparaît comme une langue très proche du français, et les effets de la proximité des langues sur leur enseignement devraient s’observer, dans son cas, de façon plus sensible que dans le cas, par exemple, de l’enseignement du russe à des tchécophones. Néanmoins, l’examen des trois manuels de picard existants, ainsi que les opinions exprimées par les picardophones eux-mêmes comme par les instances ministérielles, peuvent faire craindre que la très grande proximité du picard au français annihile la possibilité même de son enseignement, par un effet d’évaporation de son objet en tant que langue. Pourtant, dans une conception de l’enseignement des langues comme transmission d’une compétence de communication, le picard peut retrouver sa place en tant que pôle secondaire coorganisateur de la diglossie au sein de l’espace discursif régional. Cette approche implique néanmoins un travail de (re)création d’un référentiel normatif picard, destiné à le rendre visible aux yeux des locuteurs/apprenants, et donc apte à organiser cet espace discursif comme diglossie.

Consulter le document

Votre recherche

Résultats 7 ressources

Explorer

Corpus

Langue

Tâche

Type de papier