WordPerfect comme instrument de recherche

de Michel Lemaire

Université d'Ottawa (Canada)

 

bulletPréliminaires
bulletLes Index
bulletLes Bases de données
bulletAutres possibilités

 
bulletPréliminaires

Les logiciels de traitement de texte - Word ou WordPerfect, par exemple - sont utilisés d'abord comme des outils de dactylographie. Les littéraires ont sans doute généralement découvert l'ordinateur en tant que machine à écrire perfectionnée. Le bonheur, la première fois, de voir sortir de l'imprimante un texte propre et «justifié», plutôt que le gâchis laborieux qui résultait de l'utilisation du papier carbone ou du liquide correcteur. On a même pu avoir, un temps, le sentiment de mieux écrire!

Mais les logiciels de traitement de texte sont aussi des instruments de mise en page et, plus globalement, de mise en forme des textes. Au-delà de la simple justification gauche et droite ou du choix d'une police de caractères, ils permettent de produire des textes, articles ou livres, dotés d'une présentation graphique élaborée. Certaines des capacités des traitements de texte, de ce point de vue, dépassent le niveau de l'enjolivement pour atteindre celui de véritables aides à la composition. La gestion des notes en bas de page et des notes en fin de document, la constitution automatique de tables des matières structurées en sont deux exemples. L'utilisation de «macros» ou plus simplement de la «Correction rapide» qui substitue une phrase entière à une suite brève de caractères, en sont d'autres. Au stade de la composition de longs textes complexes, telle une thèse, la fonction «Document maître» de WordPerfect, permet de réaliser automatiquement la synthèse en un seul ouvrage d'une suite de chapitres composés indépendamment. Au jour le jour, le «copier-coller» et en particulier la possibilité qu'offre WordPerfect de copier successivement plusieurs fragments avant de les coller à un autre endroit du texte ou dans un autre texte, facilitent grandement le maniement des citations ou des reprises textuelles.

Ce sont là quelques exemples, choisis dans le logiciel WordPerfect, montrant comment les logiciels de traitement de texte sont en mesure d'assister les auteurs dans la rédaction d'articles ou de livres. Je voudrais maintenant - toujours en prenant mes exemples dans le logiciel WordPerfect - exposer certaines possibilités qu'offrent les logiciels de traitement de texte dans l'analyse littéraire des textes, et donc présenter ces logiciels en tant qu'instruments de recherche littéraire.

Pour pouvoir utiliser l'ordinateur dans l'analyse d'un texte, il est évidemment nécessaire de disposer d'une copie numérisée de ce texte. Il est aujourd'hui possible de se procurer sur l'Internet de nombreux textes littéraires. L'alternative est de procéder à une «entrée» à l'ordinateur du texte à étudier, soit par dactylographie soit par «reconnaissance optique» (à l'aide d'un scanner). Dans un cas comme dans l'autre, la question préalable est celle de la qualité du texte numérisé. On doit s'assurer de posséder des textes fiables, exacts jusqu'à la dernière virgule, avant de se lancer dans l'étude d'un corpus. Cet objectif peut être difficile à atteindre. D'autre part, on doit s'assurer que la graphie et la présentation du texte sont uniformes. Si l'ordinateur trouve ici des majuscules accentuées, là des majuscules non accentuées, ici des guillemets «français», là des guillemets «anglais», ici des petits tirets, là des grands tirets, ici des espaces entre les lettres et les signes de ponctuation, entre les lettres et les guillemets, là non, l'ordinateur alors classera ces chaînes de caractères dans des listes différentes. Ce second objectif d'un texte standardisé n'est pas, lui non plus, facile à atteindre dans certains cas. Mais ces étapes préliminaires sont incontournables.

 

bulletLes Index

Les capacités d'un logiciel de traitement de texte dans le repérage et dans le classement d'éléments textuels sont limitées en comparaison de celles des logiciels spécialisés d'analyse de texte ou de concordance. La fonction «Recherche» de WordPerfect permet de trouver toutes les occurrences d'une chaîne de caractères, mais de manière successive et non sous forme de tableau. On distinguera ici deux concepts: la «liste» qui est l'énumération successive de toutes les occurrences d'une chaîne de caractères, chaque occurrence étant suivie de sa localisation (il n'est donc pas question des «listes pointées» avec des puces ou des numéros); et l'«index» qui fusionne en une seule entrée toutes les occurrences d'une même chaîne, entrée suivie de la totalité des localisations.

Pour créer des listes ou des index, il est nécessaire, au préalable, de «marquer» les éléments à classer. Marquer un élément textuel signifie «sélectionner» cet élément puis ajouter un code de marque (en cliquant sur le bouton correspondant) (fonction «Liste», fonction «Index»). L'opération doit être répétée pour chaque élément qui entrera dans la liste, ce qui peut paraître fastidieux, mais ce qui se fait relativement facilement en regard des fruits qu'on récoltera de l'opération. Si on connaît à l'avance les termes qui constitueront l'index, une autre option est de composer un fichier de «concordance». Il s'agit d'une série de termes qu'on dactylographiera avant de demander à WordPerfect de trouver toutes les pages où ces termes se trouvent, pour «générer» l'index (on doit préciser à WordPerfect le nom du fichier de concordance dans la boîte de dialogue «Définir l'index»). Dans WordPerfect 8 et 9, les fonctions «Liste» et «Index» se trouvent dans le menu «Outils» à la rubrique «Référence»; dans WordPerfect 7, c'est à la rubrique «Générer» du menu «Outils».

L'intérêt d'un index (ou d'une liste d'occurrences) dépend des éléments sélectionnés. Un index est vu généralement comme une assistance fournie au lecteur. Effectivement, on peut constituer des index d'incipit, de noms propres ou de mots-clés uniquement pour faciliter la consultation d'une oeuvre littéraire; on peut aussi constituer des index de noms ou de concepts dans un ouvrage critique. Mais un index ou une liste sont aussi susceptibles de contribuer à un travail de recherche. La mesure du nombre d'occurrences dans un index peut aider à préciser l'importance d'un concept. L'étude de la distribution des éléments d'une liste (à distinguer de l'index) au fil de celle-ci peut aider à déterminer l'apparition ou la disparition d'une idée, d'un thème ou d'un personnage dans un texte. Par exemple, une liste des occurrences des noms des personnages dans une oeuvre romanesque permettra de suivre chacun des personnages, de vérifier sa présence plus ou moins importante à différents moments du récit.

D'autre part, un logiciel de traitement de texte est capable de réaliser des classements sans marquage préalable. Par exemple, WordPerfect peut classer par ordre alphabétique toutes les lignes ou tous les paragraphes d'un texte (fonction «Tri» dans le menu «Outils»). Quel intérêt dira-t-on pour une analyse littéraire? L'intérêt dépend du texte et du type d'analyse effectuée. Prenons l'exemple d'une oeuvre poétique en vers réguliers. Faisons une copie du texte de cette oeuvre, effaçons tous les éléments qui ne sont pas des vers (titres, dédicaces, etc.) Il nous reste une liste de «lignes» que WordPerfect classera par ordre alphabétique; nous serons ainsi en mesure de repérer toutes les reprises de vers, qu'elles soient voulues (refrain, auto-citation, auto-plagiat) ou non (souvenir inconscient). Dans le cas d'une édition critique, ce procédé permettra de reconnaître certaines variantes ou de déterminer la filiation de textes.

 

bulletLes Bases de données

WordPerfect offre la possibilité de créer des bases de données simples. Bien sûr un logiciel de base de données serait un instrument beaucoup plus performant, mais le logiciel de traitement de texte n'exige ni l'investissement en argent ni l'investissement en temps d'apprentissage d'un second logiciel spécialisé. Une base de données est un ensemble d'informations organisées en une structure permettant de consulter ces informations de diverses manières. Prenons l'exemple d'un carnet d'adresses: chaque entrée du carnet est composée d'informations ponctuelles: nom, prénom, adresse, numéro de téléphone; chacune de ces «rubriques» se retrouve dans chaque entrée. Dans une base de données, chacune de ces entrées constitue une «fiche». WordPerfect parle de «champ» plutôt que de «rubrique» et d'«enregistrement» plutôt que de «fiche». On ne trouve pas de commande «Base de données» dans WordPerfect; on doit aller dans le menu «Outils», sélectionner «Fusion» pour atteindre la fonction «Fichier de données».

Pour expliquer l'intérêt de bases de données simples dans la recherche littéraire, je vais développer trois exemples, en commençant par celui d'une bibliographie. Créer une base de données bibliographiques dans WordPerfect (il existe aussi des logiciels de bibliographie spécialisés) n'est pas beaucoup plus long ni plus compliqué que dactylographier la même bibliographie. Imaginons que nous étudions un auteur qui a publié une multitude de textes dans de nombreux périodiques. Chaque entrée bibliographique va constituer une «fiche» de la base de données, un «enregistrement» WordPerfect. La subtilité de la création d'une base de données réside dans la définition des «champs» (ou des «rubriques») composant chaque «enregistrement». La productivité de la base de données dépendra de la qualité de ces rubriques. WordPerfect demande d'abord de définir «champs» et «enregistrements», puis le travail consiste simplement à entrer les informations dans les cases de chaque fiche fournie (WordPerfect 6 demandait de placer des codes de «champ» et d'«enregistrement»).

Dans le cas de notre bibliographie, nous pouvons diviser l' «enregistrement» en un certain nombre de «champs»: nom de l'auteur, titre de l'article, titre du périodique, numéro de publication, date de publication, page, type de texte (compte rendu, chronique, fiction, poème, etc.) Chaque entrée bibliographique est dactylographiée en étant subdivisée entre ces diverses rubriques. L'intérêt de l'exercice est de permettre, par la suite, des classements différents en fonction de chacune des rubriques. On pourra classer les informations de la base de données ainsi constituée par ordre alphabétique de titres d'article, par titres de périodique, par dates de publication, par types de texte, etc. Le chercheur littéraire sera, de cette manière, en mesure de préciser l'évolution de la participation de l'auteur étudié: il collabore à tel périodique à telle époque, il donne en même temps des textes à deux périodiques antagonistes, il publie d'abord tel type de texte puis tel autre, il cesse de publier entre telle et telle date, etc. Et WordPerfect permet de combiner les requêtes (par exemple, classer par nom de périodique et par date de publication). Enfin, n'oublions pas que cette base de données sera aussi la source de la bibliographie publiée: il suffira de demander à WordPerfect d'afficher toutes les données, d'effacer les codes de «champ» et d'«enregistrement» (ce qui peut se faire automatiquement) et d'ajouter des virgules et des points.

Prenons maintenant l'exemple de l'étude de l'oeuvre poétique d'un auteur, disons du XIXe siècle. Dans la base de données sur cette oeuvre, chaque poème constituera une fiche (un «enregistrement»). Chaque enregistrement pourra être subdivisé par les «champs» suivants: titre du poème, genre de poème (sonnet, rondel, poème en quatrains, etc.), type de vers (alexandrin, octosyllabe, poème hétérométrique, etc.), date de publication, mot-clé. Le concept de «mot-clé» n'a pas à être défini précisément ici: dans le cas de cette rubrique comme dans le cas des autres, il importe uniquement que les rubriques soient remplies de manière cohérente avec un vocabulaire constant; mais le mot-clé ici pourrait être le thème ou le sujet du poème. La base de données ainsi constituée permettra, entre autres, d'étudier la distribution chronologique du sonnet en alexandrins dans cette oeuvre, ou l'apparition de poèmes hétérométriques à la même époque que celle du thème du coucher de soleil...

Dernier exemple: l'étude d'une correspondance. Chaque lettre, ici, constituera un «enregistrement». Les «champs» dépendront, comme dans l'exemple précédent, de ce que l'on recherche. Ce pourra être: le nom de l'expéditeur, le nom du destinataire, le lieu, la date, un mot-clé. Il devient intéressant de créer une base de données dès que les éléments à traiter sont trop nombreux pour pouvoir être mémorisés facilement. Dans le cas d'une correspondance comprenant des centaines de lettres ainsi que de multiples expéditeurs et destinataires, une base ainsi conçue permettrait de cerner les mouvements entre les interlocuteurs, les rapprochements, les éloignements, ou l'évolution des sujets d'échange.

 

bulletAutres possibilités

Les logiciels de traitement de texte n'ont pas été conçus pour faire de la recherche littéraire, mais ils constituent un espace de travail sur les textes. C'est aux chercheurs littéraires en tant que communauté, et c'est à chaque chercheur dans le cadre de sa recherche, d'inventer des procédures afin d'exploiter les possibilités du logiciel. Je distinguerai quatre étapes: inventer la procédure (en fonction des besoins de la recherche en cours); entrer les données (étape qui peut être fastidieuse); formuler la requête (l'ordinateur ne fait que répondre à une question); analyser les résultats (les résultats bruts donnent de longues listes ou de beaux tableaux mais sont sans intérêt). Tout part donc de l'invention d'une procédure spécifique visant à demander au traitement de texte de répondre à une question déterminée par les besoins de la recherche en cours. Cette procédure résultera de la mise en relation d'une «fonction» du traitement de texte avec une «problématique» propre à la recherche. Il s'agit donc, en quelque sorte, d'un détournement des «outils» fournis par le logiciel.

En voici quelques suggestions supplémentaires. La fonction «Comparer» (menu «Fichier», rubrique «Document») de WordPerfect est conçue pour contrôler les progrès d'un texte en cours de rédaction. Cependant, si on possède à l'ordinateur les diverses versions d'un texte littéraire dont on désire étudier l'évolution, on a là un outil qui peut être pratique. La comparaison, ou plus largement la mise en relation, est d'ailleurs une activité fondamentale de l'esprit humain (on pourrait y trouver une définition de l'intelligence); c'est aussi une activité fondamentale de tout chercheur, littéraire ou autre. On compare des textes, on les met en relation entre eux, ou on établit des relations entre des textes et des concepts. Si on ne peut demander à l'ordinateur de penser, on peut lui demander assistance pour réaliser la mise en relation. Le «multi-fenêtrage» est particulièrement pratique pour ce faire. De même qu'on place sur son bureau divers textes pour les comparer, ou diverses fiches pour construire une argumentation, de même peut-on afficher simultanément à l'écran de l'ordinateur plusieurs fichiers afin de les étudier ensemble. Et l'ordinateur laisse déplacer les informations d'une «fenêtre» à l'autre ou incorporer des informations supplémentaires.

Disons enfin que WordPerfect fournit sur un fichier ouvert (un texte, dans le domaine qui nous occupe) diverses informations chiffrées, intéressantes en particulier dans le cas d'analyses stylistiques. Ces chiffres sont cachés dans le menu «Fichier», à la rubrique «Document», section «Sommaire», onglet «Informations» pour WordPerfect 7; «Fichier / Propriétés / Informations» pour WordPerfect 8 et 9. Je sais ainsi que cet article contient actuellement 2428 mots et que mes phrases comprennent en moyenne 23 mots. Rien ne m'empêcherait d'appliquer cet outil à l'étude de l'oeuvre d'un auteur. Je serais ainsi en mesure d'obtenir ces informations chiffrées (et d'autres) pour l'ensemble de son oeuvre ou pour une section de son oeuvre; je pourrais comparer ces chiffres pour diverses époques de son oeuvre (par exemple, comparer des romans successifs), ou comparer ces chiffres à ceux d'autres auteurs.

L'utilisation de WordPerfect en tant qu'instrument de recherche fait appel, on le voit, à des «outils» fournis avec le logiciel, outils qui ne sont pas toujours les plus connus ou qui ne sont pas les plus fréquemment utilisés. Dans le but de «détourner» ainsi le logiciel de traitement de texte en instrument de recherche, et pour être en mesure de travailler dans cette nouvelle application avec facilité, je suggérerais enfin de créer une ou des «barres d'outils» personnalisées. La barre d'outils ou «barre de boutons» contient les icônes de commande des fonctions les plus utilisées du logiciel. Mais il est très facile de créer, pour son usage personnel, une ou des barres de boutons contenant uniquement les fonctions que l'on désire (clic droit sur un endroit vide de la barre de boutons, choisir «Préférences» dans la boîte de dialogue qui s'ouvre en WordPerfect 7, «Paramètres» en WordPerfect 8 et 9). On peut ainsi placer à côté des boutons de mise en page habituels, les boutons de création de note en bas de page, de note de fin de document, le bouton de «Fusion» (base de données), le bouton de «Tri», le bouton de multi-fenêtrage en «Mosaïque», le bouton d'«Ajout» (copie multiple dans le presse-papier), etc. On constitue de cette manière soit une unique barre de boutons personnelle, soit quelques barres adaptées à des tâches spécifiques (WordPerfect permettant de les mettre en mémoire et de choisir l'une ou l'autre).

On comprend par tous ces exemples qu'un ordinateur est une auberge espagnole: on y trouve ce qu'on y apporte. L'ordinateur est un outil. C'est un outil aux capacités multiples et étonnantes. Dans le domaine de la recherche littéraire, les efforts ont porté jusqu'ici surtout sur l'analyse statistique des textes. Pour d'autres approches, nous ne faisons qu'entrevoir et commencer à développer les capacités de cet outil. L'ordinateur ne rechigne pas à effectuer des tâches répétitives, des classements énormes, des calculs infinis. Des programmes spécialisés sont conçus pour réaliser certaines de ces tâches sur des textes. Mais le logiciel de traitement de texte que chacun possède cache déjà des trésors qu'il ne tient qu'à nous d'exploiter. L'ordinateur est un bel outil; mais un outil ne donne un bel ouvrage que s'il est bien utilisé.

 

2000

 

Voir dans l'Encyclopédie de l'Astrolabe:

L'Analyse par tableaux. I - Principes