SATO 4.4, Manuel de référence (mars 2007) | |
Table des matières | Définitions | |
Les fonctions de gestion du bureau sur le serveur | |
---|---|
En ouvrant une session de travail en mode intégral, l'usager a d'abord accès à son bureau sur le serveur SATO. Le bureau donne accès à un ensemble d'outils permettant à l'utilisateur de gérer ses fichiers sur le serveur et de soumettre un corpus à SATO. C'est aussi à partir du bureau que l'utilisateur pourra ouvrir et analyser un corpus préalablement soumis à SATO. | |
Analyser Outils |
ANALYSER permet d'appeler les fonctions d'analyse de SATO sur un corpus déjà soumis. Il peut s'agir de corpus publics ou de corpus privés résidant sur l'espace-disque de l'usager. Les corpus publics se présentent en diverses catégories qui se révèlent lorsqu'on déroule le menu en cliquant sur Corpus publics. Si on choisit de cliquer sur Corpus personnels, le répertoire des corpus déja soumis à SATO apparaît dans la fenêtre centrale.
On peut trier le répertoire d'après les entrées de l'une ou l'autre colonne du tableau en cliquant sur le titre de la colonne. On sélectionne un corpus en cliquant sur le bouton radio qui y correspond. Finalement, on soumet la requête en cliquant sur le bouton Analyser le corpus.
En mode analyse, la syntaxe des commandes SATO suit la logique générale suivante: Objet - Action - Paramètres. L'objet est une composante manipulable par SATO, par exemple le lexique du texte ou des analyseurs.
La liste des actions que l'on peut appliquer sur un objet apparaîtra dans la fenêtre de gauche lorsque l'objet aura été sélectionné. Les actions prennent la forme de verbes généraux dont le sens spécifique dépend de chaque objet. Par exemple, le verbe «appliquer» veut dire, de façon générale, faire ou effectuer.
Finalement, les paramètres s'appliquant à l'action seront présentés sous forme de formulaire dans la fenêtre centrale de l'écran. Une fois que tous les paramètres de la commande auront été fournis, le résultat de l'action sera aussi affiché dans la fenêtre centrale.
La fenêtre du bas est réservée au journal et permet de voir les commandes fournies à SATO durant le cours de la session. Elle servira également à la catégorisation des mots affichés en hyperliens dans la partie centrale de l'écran.
OUTILS comprend deux sections : FICHIER et SOUMISSION À SATO.
Remarque. Comme le menu du bureau peut donner accès à divers logiciels, il est possible que de nouveaux onglets soient présents pour accéder à des logiciels tiers.
La section OUTILS/FICHIER permet à l'usager de gérer ses fichiers dans son espace personnel sur le serveur SATO. Voici les outils disponibles.
L'option 1 (Remplacement d'une chaîne de caractères) correspond à une version sophistiquée de l'opération classique de recherche/remplace. Elle permet de traiter d'un coup un ensemble de fichiers et offre la possibilité d'utiliser des expressions régulières sous forme de filtres en langage PERL. Cela permet de réaliser automatiquement des opérations complexes de mise en forme qui seraient très longues à faire manuellement. De multiples livres et pages web expliquent l'utilisation des expressions régulières, ici dans leur syntaxe Perl. Voici un tableau qui donne quelques indications sur les opérateurs de filtrage de Perl.
Dans la chaîne cherchée, plusieurs caractères seront considérés comme des opérateurs à moins d'être précédés du caractère \; C'est le cas des caractères suivants:
Dans la chaîne de remplacement, on a :
On peut spécifier dans la chaîne à chercher si la fouille est sensible à la casse par l'opérateur (?i). L'opérateur (?s) permet de considérer une fin de ligne comme un caractère reconnsaissable par le joker universel «.» décrit plus bas. |
Les options 2, 3 et 4 permettent de définir, d'éditer et d'appliquer un fichier de filtres de remplacement. Ces fichiers (extension .fil) comportent des paires de lignes. La première, qui débute par ?, contient la chaîne à chercher. La seconde, qui débute par =, contient la chaîne de remplacement. Toute autre ligne est considérée comme un commentaire. Ici encore, on peut indiquer que les filtres font appel aux expressions régulières de Perl.
L'option 5 permet de changer le format d'encodage des caractères, par exemple pour passer de l'isolatin à l'UTF-8.
Les option 6 et 7 sont utilisées pour convertir des corpus en format texte afin de les traîter par divers logiciels d'analyse textuelle. Pour ce faire, le réseau ATONET (www.atonet.net) a convenu d'un format pivot en XML utilisant un ensemble minimal de balises conformes aux recommandations du Text Encoding Initiative (www.tei-c.org). L'option 6 permet de convertir du format pivot XML vers un format propriétaire alors que l'option 7 permet de passer du format propriétaire au format pivot.
Finalement, les options 8 et 9 permettent de modifier les entêtes des corpus en format SATO ou en format XML-TEI.
Une fois qu'on a choisi l'opération à effectuer, la première étape consiste à définir un patron de sélection des fichiers d'après le nom et le suffixe. Le patron est de type fichier.suffixe; «*» peut être utilisé comme joker. Par exemple, «a*.t*» repère tous les fichiers dont le nom débute par «a» et le suffixe par «t». Certains suffixes sont utilisés par SATO de façon conventionnelle pour identifier le contenu des fichiers manipulés par le logiciel et ses applications : voir Suffixes de fichiers compris par SATO
La section OUTILS/SOUMISSION permet de créer et de soumettre à SATO un corpus au moyen d'un formulaire HTML. On peut aussi soumettre à SATO un corpus déjà envoyé.