Bibliography
Votre recherche

Votre recherche

Aide

L’interface de recherche est composée de trois sections : Rechercher, Explorer et Résultats. Celles-ci sont décrites en détail ci-dessous.

Vous pouvez lancer une recherche aussi bien à partir de la section Rechercher qu’à partir de la section Explorer.

Rechercher

Cette section affiche vos critères de recherche courants et vous permet de soumettre des mots-clés à chercher dans la bibliographie.

Chaque nouvelle soumission ajoute les mots-clés saisis à la liste des critères de recherche.
Pour lancer une nouvelle recherche plutôt qu’ajouter des mots-clés à la recherche courante, utilisez le bouton Réinitialiser la recherche, puis entrez vos mots-clés.
Pour remplacer un mot-clé déjà soumis, veuillez d’abord le retirer en décochant sa case à cocher, puis soumettre un nouveau mot-clé.
Vous pouvez contrôler la portée de votre recherche en choisissant où chercher. Les options sont :
- Partout : repère vos mots-clés dans tous les champs des références bibliographiques ainsi que dans le contenu textuel des documents disponibles.
- Dans les auteurs ou contributeurs : repère vos mots-clés dans les noms d’auteurs ou de contributeurs.
- Dans les titres : repère vos mots-clés dans les titres.
- Dans tous les champs : repère vos mots-clés dans tous les champs des notices bibliographiques.
- Dans les documents : repère vos mots-clés dans le contenu textuel des documents disponibles.
Vous pouvez utiliser les opérateurs booléens avec vos mots-clés :
- ET : repère les références qui contiennent tous les termes fournis. Ceci est la relation par défaut entre les termes séparés d’un espace. Par exemple, a b est équivalent à a ET b.
- OU : repère les références qui contiennent n’importe lequel des termes fournis. Par exemple, a OU b.
- SAUF : exclut les références qui contiennent le terme fourni. Par exemple, SAUF a.
- Les opérateurs booléens doivent être saisis en MAJUSCULES.
Vous pouvez faire des groupements logiques (avec les parenthèses) pour éviter les ambiguïtés lors de la combinaison de plusieurs opérateurs booléens. Par exemple, (a OU b) ET c.
Vous pouvez demander une séquence exacte de mots (avec les guillemets droits), par exemple "a b c". Par défaut la différence entre les positions des mots est de 1, ce qui signifie qu’une référence sera repérée si elle contient les mots et qu’ils sont consécutifs. Une distance maximale différente peut être fournie (avec le tilde), par exemple "a b"~2 permet jusqu’à un terme entre a et b, ce qui signifie que la séquence a c b pourrait être repérée aussi bien que a b.
Vous pouvez préciser que certains termes sont plus importants que d’autres (avec l’accent circonflexe). Par exemple, a^2 b c^0.5 indique que a est deux fois plus important que b dans le calcul de pertinence des résultats, tandis que c est de moitié moins important. Ce type de facteur peut être appliqué à un groupement logique, par exemple (a b)^3 c.
La recherche par mots-clés est insensible à la casse et les accents et la ponctuation sont ignorés.
Les terminaisons des mots sont amputées pour la plupart des champs, tels le titre, le résumé et les notes. L’amputation des terminaisons vous évite d’avoir à prévoir toutes les formes possibles d’un mot dans vos recherches. Ainsi, les termes municipal, municipale et municipaux, par exemple, donneront tous le même résultat. L’amputation des terminaisons n’est pas appliquée au texte des champs de noms, tels auteurs/contributeurs, éditeur, publication.

Explorer

Cette section vous permet d’explorer les catégories associées aux références.

Les catégories peuvent servir à affiner votre recherche. Cochez une catégorie pour l’ajouter à vos critères de recherche. Les résultats seront alors restreints aux références qui sont associées à cette catégorie.
Dé-cochez une catégorie pour la retirer de vos critères de recherche et élargir votre recherche.
Les nombres affichés à côté des catégories indiquent combien de références sont associées à chaque catégorie considérant les résultats de recherche courants. Ces nombres varieront en fonction de vos critères de recherche, de manière à toujours décrire le jeu de résultats courant. De même, des catégories et des facettes entières pourront disparaître lorsque les résultats de recherche ne contiennent aucune référence leur étant associées.
Une icône de flèche () apparaissant à côté d’une catégorie indique que des sous-catégories sont disponibles. Vous pouvez appuyer sur l’icône pour faire afficher la liste de ces catégories plus spécifiques. Par la suite, vous pouvez appuyer à nouveau pour masquer la liste. L’action d’afficher ou de masquer les sous-catégories ne modifie pas vos critères de recherche; ceci vous permet de rapidement explorer l’arborescence des catégories, si désiré.

Résultats

Cette section présente les résultats de recherche. Si aucun critère de recherche n’a été fourni, elle montre toute la bibliographie (jusqu’à 20 références par page).

Chaque référence de la liste des résultats est un hyperlien vers sa notice bibliographique complète. À partir de la notice, vous pouvez continuer à explorer les résultats de recherche en naviguant vers les notices précédentes ou suivantes de vos résultats de recherche, ou encore retourner à la liste des résultats.
Des hyperliens supplémentaires, tels que Consulter le document ou Consulter sur [nom d’un site web], peuvent apparaître sous un résultat de recherche. Ces liens vous fournissent un accès rapide à la ressource, des liens que vous trouverez également dans la notice bibliographique.
Le bouton Résumés vous permet d’activer ou de désactiver l’affichage des résumés dans la liste des résultats de recherche. Toutefois, activer l’affichage des résumés n’aura aucun effet sur les résultats pour lesquels aucun résumé n’est disponible.
Diverses options sont fournies pour permettre de contrôler l’ordonnancement les résultats de recherche. L’une d’elles est l’option de tri par Pertinence, qui classe les résultats du plus pertinent au moins pertinent. Le score utilisé à cette fin prend en compte la fréquence des mots ainsi que les champs dans lesquels ils apparaissent. Par exemple, si un terme recherché apparaît fréquemment dans une référence ou est l’un d’un très petit nombre de termes utilisé dans cette référence, cette référence aura probablement un score plus élevé qu’une autre où le terme apparaît moins fréquemment ou qui contient un très grand nombre de mots. De même, le score sera plus élevé si un terme est rare dans l’ensemble de la bibliographie que s’il est très commun. De plus, si un terme de recherche apparaît par exemple dans le titre d’une référence, le score de cette référence sera plus élevé que s’il apparaissait dans un champ moins important tel le résumé.
Le tri par Pertinence n’est disponible qu’après avoir soumis des mots-clés par le biais de la section Rechercher.
Les catégories sélectionnées dans la section Explorer n’ont aucun effet sur le tri par pertinence. Elles ne font que filtrer la liste des résultats.

Langue

Alsacien

Tâche

Tokenisation

Chercher parmi les résultats...

Chercher dans...

Résultat 1 ressource

Date décroissante Date croissante Auteur A-Z Auteur Z-A Titre A-Z Titre Z-A

Résumés

Bernhard, D., Todirascu, A., Martin, F., Erhart, P., Steiblé, L., Huck, D., & Rey, C. (2017). Problèmes de tokénisation pour deux langues régionales de France, l’alsacien et le picard. DiLiTAL 2017, 14–23. https://hal.science/hal-01539160

La tokénisation est une étape essentielle dans tout système de traitement automatique des langues, d’autant plus que de nombreux outils dépendent du découpage obtenu. La tâche est particulièrement ardue pour les textes qui ne respectent pas les conventions orthotypographiques ou les langues pour lesquelles ces conventions ne sont pas stabilisées. Nous nous intéressons ici aux cas de deux langues régionales de France, l’alsacien et le picard. Nous présentons les défis posés par ces deux langues, et proposons des critères de découpage implémentés dans des tokéniseurs.

Consulter le document

RIS

Format recommandé pour la plupart des logiciels de gestion de références bibliographiques

BibTeX

Format recommandé pour les logiciels spécialement conçus pour BibTeX

Flux web personnalisé

Dernière mise à jour depuis la base de données : 23/06/2025 15:08 (UTC)

Explorer

Langue

Alsacien
Picard (1)

Tâche

Tokenisation