COLAF
COLAF
A Propos
Financeurs
Partenaires
Equipe
Résultats
Publications
Sources bibliographiques
Ressources identifiées
Contact
Clair
Sombre
Automatique
Français
English
Résultats
Outils
Deucalion
Service de lemmatisation
Pyrrha
Outil de post-correction
Release the Kraken (RTK)
Librairie python pour la gestion de tâches image>TEI
Schéma XML-TEI
Documentation et schéma pour la structuration des données textuelles COLaF
Sign similarity
Outil pour la comparaison phonologique entre signes de langue des signes
Transcription automatique
Script pour entraîner un moteur de transcription automatique dans une nouvelle langue
Données
Concours Picard
Prose, poésies et scènes de théâtre produites dans le cadre d’un concours d’écriture
Layout Analysis Dataset with SegmOnto (LADaS)
Dataset diachronique et multiformat pour l’analyse de la mise en page
Molyé
Corpus de textes modernes pour l’étude des variations du français et premiers créoles
Travaux en cours
100chansonsdeProvence
Corpus de chansons en occitan provençal avec alignements entre conventions graphiques et traductions en français
Campagne Common Voice
Collection de données vocales spontanées en langues de France
ForumOccitania
Corpus de dicussions en occitan issues d’un forum en ligne
LADaS2TEI
Programme python ALTO2TEI
Nubis
Textes issus de la bibliothèque numérique de la Sorbonne
OcWikiDialects
Corpus d’articles Wikipedia étiquetés en variétés d’occitan