SATO 4.4, Manuel de référence (mars 2007)
Table des matières | Définitions
Dictionnaire tabulaire
... permet de catégoriser un lexique en consultant un fichier prenant la forme d'un tableau dont les colonnes sont séparées par des tabulations. Comme ce type de dictionnaire est généralement issu d'une exportation en format csv à partir d'un logiciel de type tableur, le dictionnaire tabulaire est un fichier portant, normalement, le suffixe .cvs. Même si l'acronyme csv (Comma-separated values) suggère une séparation des colonnes par des virgules, on doit plutôt choisir le caractère de tabulation comme séparateur de colonnes et omettre l'encadrement des valeurs par un caractères comme le guillemet. Dans cette exportation, la première colonne correspond à la forme lexicale et les autres colonnes aux valeurs de propriété de la forme. La première ligne du tableau donne le nom des propriétés, sauf pour la première colonne, qui correspond à l'entrée lexicale, dont le nom ne sera pas utilisé. Les lignes suivantes contiennent les entrées du dictionnaire.
Exploitation :
APPLIQUER
Gestion :
DÉFINIR
ÉDITER

Exemple :
Exemple 1 - Dictionnaire tabulaire appliquer

Appliquer
Syntaxe :
DICTIONNAIRE TABULAIRE APPLIQUER fichier POUR filtre

APPLIQUER permet de consulter un dictionnaire pour l'appliquer sur le lexique d'un corpus. Pour chaque entrée repérée, et pour chaque colonne du dictionnaire tabulaire, la commande attribuera à la propriété lexicale correspondante la valeur inscrite dans la colonne. Évidemment, les colonnes dont le nom apparait dans le tableau doivent correspondre à des propriétés compatibles dans le lexique du corpus. Si le nom d'une colonne ne correspond à aucune propriété valide, la colonne sera ignorée.

Le paramètre filtre (valeur implicite « $») permet de sélectionner les entrées lexicales pour lesquelles SATO va consulter le dictionnaire.

Normalement, l'attribution de valeurs à une propriété à partir du dictionnaire se fait par remplacement de l'ancienne valeur. L'option AJOUTER indique que les valeurs trouvées seront plutôt ajoutées aux valeurs existantes. À l'inverse, l'option RETIRER indique que les valeurs trouvées seront retirées de la propriété.

Voir : Exemple 1 - Dictionnaire tabulaire appliquer.


Définir

DÉFINIR permet de définir un dictionnaire tabulaire. Cette fonction fait partie de l'interface de gestion et n'est pas une commande de SATO. Le contenu d'un dictionnaire tabulaire devrait être copié à partir d'une application qui reconnait les espaces de tabulation (tel un chiffrier).


Éditer

ÉDITER permet de modifier un dictionnaire tabulaire. Cette fonction fait partie de l'interface de gestion et n'est pas une commande de SATO.


Exemple: Appliquer

Exemple 1. Exemple d'application d'un dictionnaire tabulaire. Voici un exemple d'un tel tableau inscrit sur le fichier «fabletab.txt» :

f1f2règne
corbeau58animal
maître21animal
renard15animal

Si, pour un texte donné, nous avions défini les propriétés f1 et f3 entières pour le lexique, alors la commande :

DICTIONNAIRE TABULAIRE APPLIQUER tableau.csv POUR $

permettrait de catégoriser tous les lexèmes ($) avec les valeurs associées aux propriétés f1 et f3. Le champ f2 serait ignoré puisqu'il ne correspond à aucune propriété.

Voir la commande : APPLIQUER