Prolégomènes à l’élaboration de la base de données lexicographiques du créole haïtien

— Par Robert Berrouët-Oriol, linguiste-terminologue —

« Prolégomènes » (subst. masc. plur.) « Préambule, explication préliminaire, entrée en matière ». « Ensemble des notions préliminaires nécessaires à l’étude d’une science, d’une question particulière » (ORTHOlang, Centre national de ressources textuelles et lexicales, Université de Nancy).

Les études de nature linguistique portant sur le créole haïtien remontent aux années 1930. Il est en effet attesté que les deux œuvres pionnières de la créolistique, au sens moderne du terme, ont été élaborées par la linguiste anthropologue haïtienne Suzanne Comhaire-Sylvain et par son compatriote Jules Faine. Suzanne Comhaire-Sylvain est l’auteure de « Le créole haïtien : morphologie et syntaxe (Éditions Caravelle, Port-au-Prince, 1936 ; réédité à Genève, Slatkine Reprints, 1979). La même année paraissait le livre « Philologie créole » de Jules Faine (1ère édition Imprimerie de l’État, Port-au-Prince, 1936). L’ouvrage de Jules Faine porte le sous-titre « Études historiques et étymologiques sur la langue créole d’Haïti ». Au cours des dernières décennies, la créolistique a fourni nombre d’études majeures sur la syntaxe, la phonologie et la morphologie du créole haïtien, et elle a également élaboré plusieurs études que l’on peut logiquement classer à la rubrique des outils théoriques capables d’éclairer la réflexion sur la méthodologie d’élaboration des dictionnaires et des lexiques créoles. Une recherche documentaire ciblée permet donc d’accéder à des études fondatrices qui consignent des données en lien avec la méthodologie d’élaboration des dictionnaires et des lexiques créoles. Ainsi, Dominique Fattier est l’auteure de « La lexicographie créole saisie à l’état naissant (Ducoeurjoly 1802) », publié par Marie-Christine Hazaël-Massieux / Didier de Robillard (éds) dans « Contacts de langues, contacts de cultures, créolisation », Paris, L’Harmattan, 1997. Elle est l’auteure de « Contribution à l’étude de la genèse d’un créole : l’Atlas linguistique d’Haïti, cartes et commentaires », thèse de doctorat d’État, Université de Provence, 5 t., 1998, publiée aux Presses universitaires du Septentrion, Villeneuve d’Ascq, 1998). De son côté, la linguiste Annegret Bollée, membre fondateur du « Comité international des études créoles (CIEC) » en 1976, a produit une étude de grande amplitude historique et analytique, « Lexicographie créole : problèmes et perspectives » (Revue française de linguistique appliquée, 2005/1, vol. X).

C’est toutefois la linguiste Marie-Christine Hazaël-Massieux qui a fourni le plus ample fonds d’études théoriques en lien avec la lexicographie créole, notamment (1) « Les corpus créoles », Revue française de linguistique appliquée 1996/2 (vol. I) ; (2) « Prolégomènes à une néologie créole », Revue française de linguistique appliquée 2002/1 (vol. VII) ; (3) « Les créoles à base française : une introduction », paru dans Travaux interdisciplinaires du Laboratoire parole et langage, vol. 21, 2002 ; (4) « De l’intérêt du Dictionnaire du créole de Marie-Galante de Maurice Barbotin », paru dans Créolica, septembre 2004 ; (5) « Théories de la genèse ou histoire des créoles : l’exemple du développement des créoles de la Caraïbe », dans La linguistique 2005/1 (vol. 41) ; (6) « Textes anciens en créole français de la Caraïbe. Histoire et analyse » (Paris, Publibook, 2008). (Oeuvre érudite, ce livre identifie (pages 471 à 480) des textes anciens en créole produits entre 1640 et 1822.) Marie-Christine Hazaël-Massieux a (7) publié « Les créoles à base lexicale française » (Paris, Ophrys, 2011). Elle est également l’auteure d’une imposante « Bibliographie des études créoles. Langues, cultures, sociétés‎ » (Institut d’Études créoles et francophones, Université d’‎Aix-en-Provence, 1991).

Pour sa part, le linguiste lexicographe Albert Valdman –rédacteur des plus rigoureux dictionnaires bilingues anglais-créole, voir plus bas notre « Essai de typologie de la lexicographie créole de 1958 à 2022 »–, est l’auteur lui aussi d’études de premier plan, notamment « L’évolution du lexique dans les créoles à base lexicale française » paru dans L’information grammaticale no 85, mars 2000), « Vers la standardisation du créole haïtien » (Revue française de linguistique appliquée, 2005/1 (vol. X) et « Vers un dictionnaire scolaire bilingue pour le créole haïtien ? (revue La linguistique, 2005/1 (vol. 41). Dans l’un de ses livres majeurs, « Haitian Creole. Structure, Variation, Status, Origin » (Equinox Publishing Ltd, 2015), Albert Valdman effectue une description détaillée des stratégies productives de développement du vocabulaire et traite de l’origine du lexique du créole haïtien (chapitres 5 et 6, pages 139 à 188 : « The Structure of the Haitian Creole Lexicon »).  

Le tableau suivant illustre l’ampleur et la variété des études consacrées à l’un et/ou l’autre aspect du créole (principalement pour Haïti mais également pour la Martinique et la Guadeloupe).

TABLEAU 1 / Relevé de références documentaires fournissant, pour la lexicographie créole, un éclairage sur l’un des registres suivants : histoire, cadre analytique, cadre méthodologique de référence, problèmes et perspectives

Auteur

Ouvrage

Éditeur et date de parution

Remarques de RBO

1 Pradel Pompilus

Lexique créole-français

Université de Paris, 1958

Comprend la mention « Thèse complémentaire »

2 Pradel Pompilus

Lexique du patois créole d’Haïti

SNE, 1961

3 Pradel Pompilus

État présent des travaux de lexique sur le créole haïtien

Études créoles, n° 1, 1978

4 Pradel Pompilus

Manuel d’initiation à l’étude du créole

Port-au-Prince : Impressions Magiques, 1983

5 Ernst Mirville

Éléments de lexicographie bilingue – Lexique créole-français

Bulletin de l’Institut de linguistique appliquée de Port-au-Prince (BILAP) 11, 1979

Comprend la mention « Numéro spécial »

6 Ernst Mirville

Ki jan yo fè mo nèf an kreyòl

Creole Institute, Indiana University 1984

7 Pierre Vernet

Le créole haïtien face à son introduction en salle de classe : le champ sémantique du corps humain

Études créoles, III, 2, 1980

8 Marie-Christine Hazaël-Massieux

La lexicographie et la lexicologie à l’épreuve des études créoles

Études créoles 12/2, 1989

9 Dominique Fattier

La lexicographie créole saisie à l’état naissant (Ducoeurjoly 1802)

L’Harmattan, 1997

Paru dans Marie-Christine Hazaël-Massieux / Didier de Robillard (éds), Contacts de langues, contacts de cultures, créolisation

10 Dominique Fattier

Contribution à l’étude de la genèse d’un créole : l’Atlas linguistique d’Haïti, cartes et commentaires 

Villeneuve d’Ascq, ANRT, Presses du Septentrion, 1998

Comprend 6 volumes

11 Albert Valdman

L’évolution du lexique dans les créoles à base lexicale française

L’information grammaticale no 85, mars 2000

12 Albert Valdman

Vers un dictionnaire scolaire bilingue pour le créole haïtien ? 

La linguistique, vol. 41/1, 2005

13 Albert Valdman

Vers la standardisation du créole haïtien 

Revue française de linguistique appliquée, vol. X/1, 2005

14 Albert Valdman

Le cycle vital créole et la standardisation du créole haïtien 

Études créoles X-2, 1987

15 Albert Valdman

Sur les processus lexicogénétiques du créole haïtien

Dans H. Schroeder, P. Kumschlies & M. Gonzalez (eds), Linguistik alks Kulturiwssenchaft. Festschrift für Bernd Spillner zum 60. Geburstag, Frankfurt am Main, Peter Lang, 2001

16 Annegret Bollée

Le découpage des unités lexicales

TED, Textes, Études et Documents 9, Ibis rouge, 2001

17 Annegret Bollée

Lexicographie créole : problèmes et perspectives 

Revue française de linguistique appliquée, 2005/1

18 Serge Colot

Guide de lexicologie créole

Ibis rouge, 2002

19 Raphaël Confiant

Katjil asou poblenm pawol-nef adan kréyol jôdijou

Espace créole, 11/2002

20 Marie-Christine Hazaël-Massieux

Où l’on retrouve les dictionnaires créoles… à la recherche de l’impossible définition

Hazaël-Massieux & de Robillard (éds.), 1997

Paru dans Marie-Christine Hazaël-Massieux / Didier de Robillard (éds), Contacts de langues, contacts de cultures, créolisation

21 Élodie Jourdain

Le vocabulaire du parler créole de la Martinique

Éditions Klincksieck, 1956

22 Lambert-Félix Prudent

Les nouveaux défis de la standardisation. Comment écrire les langages littéraires, techniques et scientifiques en créole martiniquais ?

Éd. modulaires européennes, Université de La Réunion, 2003

Dans Anciens et nouveaux plurilinguismes -Actes de la 6e Table ronde du Moufia

23 Michel Francard, Pergia Gkouskou-Giannakou, Axel Gauvin

Les langues créoles : éclairages pluridisciplinaires

L’Harmattan, 2017

24 Robert Berrouët-Oriol et al.

La didactisation du créole au cœur de l’aménagement linguistique en Haïti

Éditions Zémès et Éditions du Cidihca, 2021

Ouvrage collectif

Bref rappel de l’histoire de la lexicographie créole en Haïti : les pionniers, les ouvrages

Tel que nous l’avons exemplifié dans notre « Essai de typologie de la lexicographie créole de 1958 à 2022 » (journal Le National, Port-au-Prince, 21 juillet 2022) la lexicographie créole haïtienne, entendue au sens de la production d’outils lexicographiques de type lexique et dictionnaire, remonte aux travaux pionniers de Pradel Pompilus auteur, en 1958, du premier « Lexique créole-français » (Université de Paris). Notre « Essai de typologie de la lexicographie créole de 1958 à 2022 » rassemble 64 dictionnaires et 11 lexiques (unilingues créoles, bilingues français-créole et anglais-créole) élaborés en grande partie aux États-Unis (39 titres) sans doute en raison du poids démographique des migrants haïtiens dans ce pays (environ 1,5 million de locuteurs). Ce corpus dictionnairique comprend un nombre restreint d’ouvrages élaborés selon la méthodologie de la lexicographie professionnelle et un grand nombre d’ouvrages élaborés en dehors de la méthodologie de la lexicographie professionnelle.

Dans plusieurs de nos articles publiés en Haïti et en outremer, nous avons mis en lumière les caractéristiques de ces ouvrages, notamment dans (1) « Plaidoyer pour une lexicographie créole de haute qualité scientifique » (Le National, 15 décembre 2021) ; (2) « Toute la lexicographie haïtienne doit être arrimée au socle méthodologique de la lexicographie professionnelle » (Le National, 31 décembre 2022) ; (3) « Lexicographie créole : retour-synthèse sur la méthodologie d’élaboration des lexiques et des dictionnaires » (Le National, 4 avril 2023 ; (4) « La lexicographie créole en Haïti : pour mieux comprendre le rôle central de la méthodologie dans l’élaboration du dictionnaire créole » (Rezonòdwès, 16 décembre 2023).

TABLEAU 2 – Ouvrages lexicographiques (lexiques et dictionnaires) élaborés en conformité avec la méthodologie de la lexicographie professionnelle (10 ouvrages sur un total de 75 publiés entre 1958 et 2022)

Titre

Auteur(s)

Date de parution

Éditeur

1. Ti diksyonnè kreyòl-franse

Henry Tourneux, Pierre Vernet et al.

1976

Éditions caraïbes

2. Haitian Creole – English – French Dictionary (vol. I et II)

Albert Valdman (et al.)

1981

Creole Institute

Bloomington University

3. Petit lexique créole haïtien utilisé dans le domaine de l’électricité  

Henry Tourneux

1986

CNRS/Cahiers du Lacito

4. Diksyonè òtograf kreyòl ayisyen 

Pierre Vernet, B. C. Freeman

1988

Sant lengwistik aplike, Inivèsite Leta Ayiti

5. Dictionnaire préliminaire des fréquences de la langue créole haïtienne 

Pierre Vernet, B. C. Freeman

1989

Sant lengwistik aplike, Inivèsite Leta Ayiti 

6. Dictionnaire inverse de la langue créole haïtienne / Diksyonè lanvè lang kreyòl ayisyen

Bryant Freeman

1989

Sant lengwistik aplike, Inivèsite Leta Ayiti

7. Dictionnaire de l’écolier haïtien 

André Vilaire Chery et al.

1996

Hachette-Deschamps /EDITHA

8. Dictionnaire de l’évolution du vocabulaire français en Haïti (tomes 1)

André Vilaire Chery

2000

Éditions Édutex

9. Dictionnaire de l’évolution du vocabulaire français en Haïti (tome 2)

André Vilaire Chery

2002

Éditions Édutex

10. Haitian Creole-English Bilingual Dictionnary 

Albert Valdman

2007

Creole Institute, Indiana University   

Les ouvrages listés au tableau 2 se caractérisent par l’ancrage sur un socle méthodologique modélisé qui en garantit la scientificité et la crédibilité : ils  mettent tous en œuvre le même cadre méthodologique qui consiste (1) à définir le projet éditorial et les usagers-cibles visés ; (2) à identifier les sources du corpus de référence en vue de l’établissement de la nomenclature ; (3) à procéder à l’établissement de la nomenclature des termes retenus à l’étape du dépouillement du corpus de référence ; (4) à procéder au traitement lexicographique des termes de la nomenclature et à la rédaction des rubriques dictionnairiques (définitions, notes), exception faite des lexiques qui ne comprennent ni définitions ni notes.  

Il est utile de souligner deux acquis méthodologiques de premier plan du « Petit lexique créole haïtien utilisé dans le domaine de l’électricité » d’Henry Tourneux listé au deuxième tableau : il a été élaboré dans un cadre institutionnel, celui du Centre de linguistique appliquée, ancêtre de la Faculté de linguistique appliquée de l’Université d’État d’Haïti ; d’autre part, il est issu d’une observation de terrain effectuée à la centrale thermique de la ville de Saint-Marc et selon une méthodologie appropriée en lien avec des objectifs clairement identifiés. Ainsi, « Ce lexique a été recueilli à la demande du Centre de linguistique appliquée de Port-au-Prince, dirigé par Pierre Vernet, au cours d’une mission partiellement financée par I’Université René Descartes (15 décembre 1980 – 19 janvier 1981). L’enquête a été menée dans le secteur de [la ville de] Saint-Marc ainsi que dans un grand magasin spécialisé de Port-au-Prince. L’objectif visé était de recueillir un maximum de termes concernant l’électricité et son usage, afin de préparer le terrain en vue de la rédaction de manuels techniques en créole ou de livrets d’éducation populaire. La méthode d’enquête employée a été celle de l’observation directe in situ (aux risques et périls du linguiste, il faut le dire). Les résultats obtenus ne sont que partiels et seront complétés par des travaux ultérieurs du Centre de linguistique appliquée de Port-au-Prince » (source : Cahiers du Lacito/CNRS, 1, 1986, page 177).

Sur le registre de la stricte observance du protocole méthodologique de la lexicographie professionnelle, la lexicographie créole s’est durablement enrichie de l’apport de tous les dictionnaires anglais-créole élaborés au fil des ans par le linguiste lexicographe Albert Valdman et ses équipes au Creole Institute de l’Université d’Indiana (voir notre article « Lexicographie créole : revisiter le « Haitian Creole-English Bilingual Dictionnary » d’Albert Valdman » (Le National, Port-au-Prince, 31 janvier 2023). Le tableau 3 éclaire le traitement lexicographique standardisé des données dans ce dictionnaire.

TABLEAU 3 – Modélisation des rubriques lexicographiques dans le « Haitian Creole-English Bilingual Dictionnary » d’Albert Valdman (Creole Institute, Indiana University, 2007)

Terme créole

Catégorie grammaticale

Définition anglaise

Terme(s) apparenté(s)

Locutions illustratives

Renvoi(s)

pipirit1

n. [nom ou substantif]

Kind of small bird

pipirit chandèl

Anvan pipirit mete kanson li/depi pipirit chante

Gri kou pipirit /see/ gri.

Sou kon pipirit /see/ sou.

pipirit gri

pipirit gwo tèt

pipirit pa chante

pipirit rivyè

pipirit tètfou

pipirit2

/see/ pripri

[Les termes apparentés sont définis et suivis d’une illustration d’emploi. Ex. : Li kite lakay li o pipirit chantan]

Tel qu’exposé dans notre article « Lexicographie créole : revisiter le « Haitian Creole-English Bilingual Dictionnary » d’Albert Valdman » (Le National, Port-au-Prince, 31 janvier 2023), nous avons effectué l’évaluation analytique du « Haitian Creole-English Bilingual Dictionnary » selon les critères méthodologiques usuels de la lexicographie professionnelle, à savoir : (1) la formulation de la politique éditoriale et les cibles visées ; (2) la détermination du corpus de référence et le dépouillement des données ; (3) l’élaboration de la nomenclature, la rédaction des définitions, le choix des notes et des exemples illustratifs. Nous avons ainsi mis l’accent, au plan méthodologique, sur la rigueur ayant présidé la toute première phase de l’élaboration du « Haitian Creole-English Bilingual Dictionnary », celle de l’établissement du corpus de référence, étape obligatoire et indispensable de tout chantier lexicographique. « Un corpus est un ensemble de textes (d’énoncés, de phrases, de mots…) (oraux ou écrits) servant comme base pour une étude ciblée. (…) Un corpus fait office d’échantillon du langage, et se doit d’en être représentatif » (Barbara Rahma, « Approche de corpus : théories et application pratiques », séminaire 2016-2017 : dialectologie et langue du Maroc / Actes de la Journée d’études « Linguistique de terrain : description de faits et présentation de modèles », Fès, Maroc, 11 mai 2011). La détermination du corpus de référence créole du « Haitian Creole-English Bilingual Dictionnary » et le dépouillement des données issues de ce corpus ont été conduits, sur le terrain, par deux équipes auprès de locuteurs natifs du créole. L’une des deux équipes a mis à contribution les ressources de la base de données lexicales d’un projet de dictionnaire bilingue créole-français et elle a bénéficié de la contribution d’André Vilaire Chery, auteur du remarquable « Dictionnaire de l’évolution du vocabulaire français en Haïti » (tomes 1 et 2 parus en 2000 et 2002 chez Édutex). Deux linguistes haïtiens, au sein de l’équipe initiale, ont collaboré étroitement à la production du dictionnaire : Jacques Pierre, qui enseigne aujourd’hui à Duke University, et Nicolas André. Le linguiste et traducteur Nicolas André enseigne depuis quelques années à la Florida International University ; il a auparavant effectué des études de premier cycle à la Faculté de linguistique appliquée de l’Université d’État d’Haïti. Le corpus de référence du « Haitian Creole-English Bilingual Dictionnary » s’est également enrichi d’enregistrements de terrain de locuteurs natifs du créole du Nord d’Haïti, ainsi que de plusieurs sources écrites antérieures (dictionnaires anglais-créole et créole-français). L’information relative au corpus de référence et au dépouillement des données figure au premier chapitre du dictionnaire intitulé « Acknowledgments » [Remerciements].

En raison de la stricte observance du protocole méthodologique de la lexicographie professionnelle dans les dictionnaires anglais-créole élaborés au fil des ans par le linguiste lexicographe Albert Valdman, il est utile de rappeler que son œuvre dictionnairique constitue LA RÉFÉRENCE en matière d’élaboration des dictionnaires bilingues ciblant le créole. Son approche modélisée constitue une incontournable avancée de la lexicographie haïtienne et les lexicographes doivent s’en inspirer pour produire des ouvrages de haute qualité scientifique.

Il existe toutefois un grand nombre de lexiques et de dictionnaires créoles qui ont été fabriqués en dehors de la méthodologie de la lexicographie professionnelle : il s’agit d’œuvres relevant de l’amateurisme ou de la « lexicographie borlette ».

TABLEAU 4 – Échantillon de lexiques et de dictionnaires élaborés en dehors de la méthodologie de la lexicographie professionnelle

Titre de l’ouvrage

Auteur(s)

Éditeur

Année de publication

Diksyonè kreyòl Vilsen 

Maud Heurtelou, Féquière Vilsaint

Éduca Vision

1994 [2009]

Leksik kreyòl : ekzanp devlopman kèk mo ak fraz a pati 1986 

Emmanuel Védrine

Védrine Creole Project [?]

2000

Diksyonè kreyòl karayib 

Jocelyne Trouillot

CUC Université Caraïbe 

2003 [?]

Glossary of STEM terms from the MIT – Haiti Initiative 

MIT – Haiti Initiative 

MIT – Haiti Initiative 

2015 [?]

 

TABLEAU 5 – Principales caractéristiques des ouvrages élaborés en dehors de la méthodologie de la lexicographie professionnelle (échantillon de 4 publications)

Titre de l’ouvrage

Auteur(s)

Catégorie

Principales caractéristiques lexicographiques

Diksyonè kreyòl Vilsen 

Maud Heurtelou, Féquière Vilsaint

Dictionnaire unilingue créole Incohérence, insuffisance ou inadéquation de nombreuses définitions. Certaines rubriques comprennent des notes explicatives.

Leksik kreyòl : ekzanp devlopman kèk mo ak fraz a pati 1986 

Emmanuel Védrine

S’intitule « leksik » alors qu’il est un glossaire unilingue créole. Accès Web uniquement

De nombreuses entrées (« mots vedettes ») sont des slogans ou des séquences de phrases ou des proverbes. De nombreuses entrées ne sont pas des unités lexicales. Incohérence, insuffisance ou inadéquation des rares définitions.
Diksyonè kreyòl karayib 

Jocelyne Trouillot

Dictionnaire unilingue créole Incohérence, insuffisance ou inadéquation de nombreuses définitions. De nombreuses entrées (« mots vedettes ») ne sont pas des unités lexicales, ce sont plutôt des noms propres ou des toponymes…
Glossary of STEM terms from the MIT – Haiti Initiative  MIT – Haiti Initiative  Lexique bilingue anglais créole. Accès Web uniquement Équivalents créoles en grande partie fantaisistes, erratiques, a-sémantiques et non conformes système morphosyntaxique du créole

Les lexiques et les dictionnaires créoles listés aux tableaux 4 et 5 ont donc une caractéristique commune : ils ont été élaborés en dehors de la méthodologie de la lexicographie professionnelle. L’analyse atteste que les dictionnaires listés se caractérisent principalement par (1) l’incohérence, l’insuffisance ou l’inadéquation de nombreuses définitions ; (2) l’imprécision ou la fausseté de nombreux équivalents placés en entrée ; (3) l’emploi d’une phraséologie définitoire comme équivalent placé en entrée en lieu et place d’une unité lexicale ; (4) le défaut d’adéquation entre les notions de la langue de départ à celles de la langue d’arrivée.

Les ouvrages élaborés en dehors de la méthodologie de la lexicographie professionnelle sont donc porteurs de lourdes lacunes méthodologiques et dans l’ensemble ils sont l’œuvre d’amateurs autoproclamés « lexicographes » qui perpétuent, à l’aune d’un amateurisme persistant, une erratique « lexicographie borlette » (voir notre article « La lexicographie créole à l’épreuve des égarements systémiques et de l’amateurisme d’une « lexicographie borlette », Le National, Port-au-Prince, 28 mars 2023). Pareil constat est en lien avec la nécessité de produire des lexiques et des dictionnaires créoles de qualité destinés au grand public et aux écoliers et qui seront utiles à l’apprentissage scolaire en général et à l’apprentissage de la langue créole, utiles également aux rédacteurs de manuels scolaires et aux différentes catégories de langagiers (journalistes, spécialistes de la publicité, etc.). Ce constat, d’autre part, justifie pleinement la survenue et l’ancrage d’une autre vision, celle d’une lexicographie créole contemporaine qui s’élabore sur le socle de la méthodologie de la lexicographie professionnelle et qui est mise en œuvre dans un cadre institutionnel national par des professionnels de la lexicographie détenteurs d’une formation universitaire en lexicographie.

Prolégomènes à l’élaboration de la Base de données lexicographiques du créole haïtien 

En ce qui a trait à la lexicographie créole contemporaine qui devra s’élaborer sur le socle de la méthodologie de la lexicographie professionnelle, nous portons un plaidoyer à plusieurs dimensions, liées et complémentaires. Ce plaidoyer consiste à exposer les grandes lignes de l’élaboration de la Base de données lexicographiques du créole haïtien. Une base de données désigne l’« Ensemble des données automatisées, renvoyant à des unités documentaires primaires » (TermiumPlus, la banque de données terminologiques et linguistiques du gouvernement du Canada). Dans son acception la plus courante, une base de données est la version digitale d’une bibliothèque d’information. Il s’agit d’une collection d’informations interdépendantes ordonnancées et stockées électroniquement dans un système informatique (un serveur) en fonction d’objectifs identifiés et visant des utilisateurs ciblés (usagers en circuit fermé) ou visant les usagers grand public. Il y a lieu de rappeler que « Les types de bases de données sont globalement regroupés en bases de données relationnelles et non relationnelles. Les bases de données relationnelles sont très structurées et incluent un langage de programmation appelé langage SQL (SQL). Les bases de données non relationnelles sont très diversifiées et prennent en charge une grande variété de structures de données. Étant donné que de nombreuses bases de données non relationnelles n’utilisent pas SQL, elles sont souvent appelées bases de données NoSQL » (source : Plateforme Azure Microsoft.com, n.d.). De manière générale, une base de données est stockée sous la forme d’un fichier ou d’un ensemble de fichiers sur un disque ou un disque magnétique, un disque optique ou tout autre support de stockage. L’information contenue dans ces fichiers peut être divisée en enregistrements. Ces enregistrements sont constitués d’un ou de plusieurs champs. Un champ constitue une seule pièce d’information, et chaque champ contient généralement des informations se rapportant à un aspect ou attribut de l’entité décrite par la base de données » (source : Plateforme Oracle, 2024). La Base de données lexicographiques du créole haïtien (BDLCH) consistera en un répertoire informatisé évolutif rassemblant selon un protocole rédactionnel standard toutes les fiches se rapportant aux unités lexicales créoles ainsi qu’à leur catégorisation et qui attestent l’usage des termes répertoriés et ordonnancés.

Pour établir les fondations de la Base de données lexicographiques du créole, la lexicographie créole doit rigoureusement élaborer son cadre conceptuel et méthodologique et viser, parmi ses priorités immédiates, la mise en place d’un dispositif institutionnel de « veille lexicographique » devant lui permettre de circonscrire le « corpus étendu » des documents qu’elle doit dépouiller en vue de la constitution de la « nomenclature de base » des dictionnaires et des lexiques bilingues français-créole, anglais-créole et unilingues créoles. « La veille [lexicographique] est un processus continu et organisé de sélection, de collecte et d’analyse de l’information [documentaire] dans un domaine particulier qui a pour but de fournir une information pertinente » (source : LEXsic / Dictionnaire des cultures de l’information, n.d.). En lexicographie créole, la « veille lexicographique » consistera donc en l’établissement méthodique d’un dispositif institutionnel, à savoir une logistique dédiée à la recherche documentaire et dont la fonction principale consistera à observer l’apparition, la fréquence de l’usage et le contexte d’utilisation des termes et à les classer en vue de leur traitement analytique.

Au plan méthodologique, la notion de « corpus étendu » est de toute première importance car le corpus est le point de départ de toute recherche lexicographique rigoureuse. « L’acception de « corpus » pour un usage propre au domaine de la linguistique, en tant qu’« ensemble de textes établis selon un critère thématique en vue de leur étude linguistique » est attestée depuis 1855, mais il n’entre dans les dictionnaires français que plus d’un siècle plus tard (1968, pour la première attestation lexicographique). Depuis, les dictionnaires proposent généralement deux acceptions pour « corpus » : la première proviendrait de la langue du droit –« Recueil de pièces, de documents concernant une même discipline »–, la seconde [proviendrait] de la linguistique –« Ensemble limité des éléments (énoncés) sur lesquels se base l’étude d’un phénomène linguistique » (Le Petit Robert, 1989) » (voir Eliana Magnani : « Qu’est-ce qu’un corpus ? Compte-rendu de la journée d’études – 2017 » paru dans Les carnets de l’IRHT, octobre 2017). L’identification du « corpus étendu », constitué de l’ensemble des sources documentaires identifiées durant la « veille lexicographique », permettra au lexicographe d’élaborer la « nomenclature de base » des dictionnaires et des lexiques bilingues français-créole, anglais-créole et unilingues créoles. La nomenclature regroupe l’ensemble des termes —les lemmes (les unités lexicales autonomes–, identifiés et retenus à l’étape initiale du dépouillement des sources documentaires du « corpus étendu » et ces termes sont classés par ordre alphabétique. C’est à défaut d’avoir rigoureusement mis en application les principes de base relatifs à la « veille lexicographique », à la détermination du « corpus étendu » et à la constitution de la « nomenclature de base » des dictionnaires et des lexiques que de nombreux dictionnaires et lexiques créoles se sont révélés lourdement lacunaires, déficients et inadéquats (voir plus haut les tableaux 4 et 5).

Dans le cas d’Haïti, la notion de « corpus créole étendu » recouvre à la fois le corpus provenant de documents écrits (ouvrages généralistes, ouvrages spécialisés, textes publicitaires, textes de large diffusion, journaux et revues, documents administratifs divers, lois, codes, etc.) produits en Haïti et en dehors d’Haïti, ainsi que les sources orales de provenances diverses qui, une fois identifiées, seront transcrites sur un support modélisé, la fiche de dépouillement lexicographique. La problématique des sources orales dans l’élaboration du « corpus créole étendu » devra être l’objet d’une approche théorique adéquate : elle ne fait pas toujours l’unanimité entre les chercheurs d’une part, et, d’autre part, les transactions langagières orales occupent une place considérable dans un pays où l’accès à l’écrit est encore restreint. Selon certaines sources, Haïti compterait aujourd’hui encore plus de 60% d’analphabètes en dépit de plusieurs campagnes d’alphabétisation (voir Renauld Govain, « Dix nouvelles années d’alphabétisation en Haïti : quel bilan tirer ? », Le Nouvelliste, 5 septembre 2005). De surcroît, l’écrit créole, s’il s’avère être aujourd’hui en ascension constante, il occupe une place encore relativement modeste dans l’ensemble des productions écrites en Haïti (voir l’article de Edner Fils Décime, « Le créole écrit d’Haïti peine à s’imposer, malgré des avancées », AlterPresse, 28 octobre 2014). Il faut toutefois prendre toute la mesure qu’une avancée institutionnelle majeure a eu lieu récemment en Haïti avec la parution de la revue Rechèch etid kreyòl à la Faculté de linguistique appliquée de l’Université d’État d’Haïti.

La revue Rechèch etid kreyòl, dont le premier numéro est consacré à la graphie du créole, est parue en octobre 2022 et elle est l’une des deux plus jeunes revues de la créolistique. Elle est dirigée par le linguiste Renauld Govain, doyen de la Faculté de linguistique appliquée, et son comité scientifique comprend, outre des linguistes haïtiens, des linguistes de la Martinique, de l’Île de la Réunion, de l’Île Maurice, des Seychelles, des États-Unis et de la Guadeloupe. La revue Rechèch etid kreyòl s’élabore dans un cadre institutionnel, le « Laboratwa lang, sosyete, edikasyon (LangSE) de la Faculté de linguistique appliquée de l’Université d’État d’Haïti et elle est éditée par JEBCA Edisyon. Dotée d’un comité scientifique, cette revue universitaire a introduit une innovation majeure dans le champ de la créolistique : elle est publiée encréole haïtien. Pareille politique éditoriale –qui marque un tournant de premier plan dans l’élaboration en créole d’articles scientifiques traitant du créole–, est formulée comme suit : « Rechèch etid kreyòl ap pèmèt rechèch ki te fèt oubyen ki ap fèt sou lang kreyòl kapab pibliye an kreyòl. Epitou, moun ki enterese nan lanng kreyòl kapab jwenn bon jan zouti akademik pou apwofondi konesans yo nan lanng kreyòl la menm ». L’orientation éditoriale de la revue Rechèch etid kreyòlrépond certainement à la nécessité de produire en créole une réflexion académique multifacette sur la langue créole elle-même là où la créolistique jusqu’à présent avait élaboré sa production scientifique principalement en français et en anglais. Cette orientation éditoriale comporte en amont des exigences et de grands défis : (1) il faut outiller en créole un discours savant sur le créole –étape de la didactisation de ce discours–; (2) sur le plan lexical et terminologique il faut dénommer en créole les notions et les concepts produits dans une autre langue –étape de la constitution d’un vocabulaire créole dédié où l’on peut au besoin recourir aux emprunts et/ou à la création de néologismes créoles. Les exigences et les grands défis d’une telle orientation éditoriale sont d’autant plus élevés que la lexicographie haïtienne n’a pas encore élaboré un dictionnaire unilingue créole conforme aux normes de la lexicographie professionnelle ni produit des vocabulaires sectoriels scientifiques et techniques en créole. Il faut prendre toute la mesure que cette orientation éditoriale majeure de la revue Rechèch etid kreyòl  aura sur le moyen et le long terme des effets dans les domaines clés de la traduction créole, de la didactique créole et de l’élaboration de manuels scolaires de qualité en créole. Sur le plan cognitif –celui du processus de l’apprentissage et de la diffusion des connaissances et qui comprend aussi le développement du langage–, la revue Rechèch etid kreyòl  sera d’un apport de premier plan : elle contribuera à l’émergence et à la consolidation, chez les enseignants-chercheurs, d’une démarche analytique qui se pense et s’exprime en premier lieu en créole. Elle contribuera ainsi au développement des habilités cognitives en créole, et cela aura des effets sur le long terme sur l’ensemble des processus d’apprentissage scolaire en langue maternelle créole. (Sur la didactique du créole et la didactisation du créole, voir le livre collectif de référence « La didactisation du créole au cœur de l’aménagement linguistique en Haïti », par Robert Berrouët-Oriol et alii, Éditions Zémès, Port-au-Prince, et Éditions du Cidihca, Montréal, 2021.)

En ce qui a trait aux sources orales de provenances diverses, le recours aux sources orales dans l’établissement du « corpus créole étendu » devra faire l’objet d’un protocole établissant la distinction entre les sources orales issues d’enquêtes de terrain, les sources orales provenant de la presse parlée et les sources orales à prélèvement aléatoire (voir entre autres « Le corpus lexicographique dans les langues à tradition orale : le cas du dialecte fang-mekè », par Yolande Nzang-Bié (Département des Sciences du langage, Université Omar Bongo, Libreville, Gabon). La pertinence opérationnelle de la notion d’« archives orales », que l’on rencontre habituellement dans le champ des études historiques, devra également être approfondie afin de déterminer si elle pourra être mise à contribution dans l’établissement du « corpus créole étendu » (voir entre autres Vincent Duclert : « Archives orales et recherche contemporaine / Une histoire en cours » (revue Sociétés & représentations 2002/1 (no 13) ; voir aussi Florence Descamps : « Utiliser et réutiliser les archives orales. Comment faire des archives orales un outil de recherche collectif ? (Archives de la recherche & Phonothèque, 11 mars 2016).

Profil séquentiel schématisé de l’élaboration de la Base de données lexicographiques du créole haïtien (BDLCH)

  1. Exposé du projet d’élaboration de la Base de données lexicographiques du créole haïtien.

1.1. Identification de l’institution nationale chargée de la conceptualisation et de la constitution de la Base de données lexicographiques du créole haïtien : Faculté de linguistique appliquée, Université d’État d’Haïti.

1.2. Objectifs généraux, objectifs spécifiques et mission.

1.3. Création, à la Faculté de linguistique appliquée, du Laboratoire de recherche LexCRÉ spécialement dédié à l’élaboration de la Base de données lexicographiques du créole haïtien.

1.4. Élaboration du cadre méthodologique de la Base de données lexicographiques du créole haïtien.

1.5. Définition du cadre opérationnel, logistique de mise en œuvre et partenaires nationaux et internationaux potentiels.

1.6. Constitution, au plan technique/informatique, de la Base de données lexicographiques du créole haïtien en partenariat avec l’École supérieure d’infotronique d’Haïti (ESIH). 

1.7. Établissement des liens programmatiques entre le projet d’élaboration de la Base de données lexicographiques du créole haïtien et l’enseignement de la lexicographie à la Faculté de linguistique appliquée de l’Université d’État d’Haïti : préconisation d’une formation diplômante de quatre ans en lexicographie générale et en lexicographie créole.

1.8. Les droits d’auteur de la Base de données lexicographiques du créole haïtien appartiennent à Faculté de linguistique appliquée. Dans un premier temps et sur le mode de partenariats sectoriels, elle la mettra à la disposition des rédacteurs de lexiques créoles, de dictionnaires créoles et de manuels scolaires créoles. Dans un second temps, la Faculté de linguistique appliquée définira une politique d’accès public gratuit à la Base de données lexicographiques du créole haïtien.

  1. Plan de travail détaillé relatif aux objectifs généraux et aux objectifs spécifiques de l’élaboration de la Base de données lexicographiques du créole haïtien.

À l’appui de l’exposé du projet d’élaboration de la Base de données lexicographiques du créole haïtien, voici, de manière exploratoire, une première modélisation de la fiche standard de dépouillement lexicographique à l’étape de la constitution du corpus créole étendu tel que présenté auparavant dans cet article.

TABLEAU 6 – Base de données lexicographiques du créole haïtien

Corpus créole étendu

Modélisation de la fiche standard de dépouillement lexicographique

Titre du document

Auteur, date d’édition et nature du document

Date de début et de fin du dépouillement

Nombre d’unités lexicales créoles relevées et catégorie grammaticale

Remarques préliminaires en vue du classement dans la nomenclature

La faune et la flore d’Haïti (Bèt ak plant peyi dAyiti)

Kike Calvo. Août 2023. Livre de coloriage

01.02.2024 – 01.03.2024

8 subst., 4 verb., 3 adj.

Vocabulaire général + domaine éducation scolaire

Ti dife boule sou istoua Ayiti

Michel-Rolph Trouillot, 1977. Edisyon KIK, Inivèsite Karayib, 2012.

Livre d’histoire

01.02.2024 – 01.04.2024

120 subst., 14 verb., 18 adj.

Vocabulaire général + domaine histoire

La constitution de la Base de données lexicographiques du créole haïtien pourra bénéficier des acquis engrangés ailleurs, notamment à l’Université Laval où ont été centralisés les travaux de la volumineuse et rigoureuse Base de données lexicographiques panfrancophone (BDLP) et à l’Université de Sherbrooke où s’élabore depuis quelques années le dictionnaire USITO. Il est utile de rappeler que les données lexicographiques de la Base de données lexicographiques panfrancophone (BDLP) ont été intégrées au monumental « Dictionnaire des francophones », le DDF, accessible gratuitement sur Internet. Cet ouvrage numérique et collaboratif lancé en 2021 comprend aujourd’hui près de 480 000 mots et locutions et 620 000 définitions qui reflètent les divers usages du français à travers le monde (voir notre article « Le DDF, « Dictionnaire des francophones », un monumental répertoire lexicographique de 400 000 termes et expressions accessible gratuitement sur Internet », Médiapart, Paris, 22 mars 2021). Plusieurs termes du français haïtien sont répertoriés dans le « Dictionnaire des francophones » : « acra », « cassave », « rigoise », « malandrin », « zenglendo », « macoute »…

Un modèle inspirant de base de données lexicographiques : la « Base de données lexicographiques panfrancophone (BDLP)

La lexicographie créole a tout à gagner à s’inspirer des acquis méthodologiques et de l’expertise acquise dans diverses institutions lexicographiques à l’échelle internationale au fil des ans –notamment et tel que mentionné plus haut à l’Université de Sherbrooke et à l’Université Laval, ainsi qu’à l’Université des Antilles en Martinique. C’est dans l’environnement de l’Université des Antilles en Martinique que le romancier et lexicographe Raphaël Confiant a élaboré son remarquable « Dictionnaire créole martiniquais – français comprenant 15 000 entrées (Éditions Ibis rouge, Matoury, Guyane, 2007).

Pour sa part, « La base de données lexicographiques panfrancophone (BDLPest une base de données dont l’objectif est de constituer et de regrouper des bases représentatives du français de chacun des pays et de chacune des régions de la francophonie. « La Base de données lexicographiques panfrancophone (BDLP) est un projet d’envergure internationale qui s’inscrit dans l’entreprise du Trésor des vocabulaires français, lancée par le professeur Bernard Quemada dans les années 1980. La BDLP est actuellement en voie de réalisation pour les pays et régions figurant ci-dessus, mais d’autres équipes se préparent à s’y associer. L’objectif est de constituer et de regrouper des bases représentatives du français de chacun des pays et de chacune des régions de la francophonie. Les bases de données sont conçues de façon à pouvoir être interrogées de façon séparée ou comme un seul corpus et à servir de complément au Trésor de la langue française informatisé, implanté au centre Analyse et traitement informatique du lexique français (ATILF) de Nancy.

Dans sa dimension internationale, le projet de la BDLP est patronné par l’Agence universitaire de la Francophonie qui l’a appuyé dès le départ à travers son réseau Étude du français en francophonie qui continue de lui apporter son aide. Le Comité scientifique de ce réseau avait établi, lors de sa réunion de mars 2001, que la BDLP devenait le projet structurant de ses activités. Dans ce contexte, des équipes du Sud et du Nord ont pu recevoir l’aide technique nécessaire à la réalisation de bases nationales ou régionales, notamment à travers un programme de stages. Le gouvernement du Québec a contribué au projet en défrayant les coûts de recherche, d’élaboration des outils informatiques et d’assistance technique. À cet égard, le Secrétariat à la politique linguistique du Québec a joué un rôle de première importance dans les premières années de l’entreprise. Note : La BDLP internationale a été mise en ligne le 18 mars 2004, dans le cadre de la Semaine de la Francophonie. Les bases ont été grandement enrichies depuis et de nouvelles bases ont été ouvertes. Des mises à jour sont effectuées régulièrement » (source : BDLP – Internationale, 2001-2014 AUF et TLFQ). Une présentation détaillée de la Base de données lexicographiques panfrancophone (BDLPest consignée dans l’article du lexicographe québécois Claude Poirier, « Une représentation dynamique de la francophonie : la base de données lexicographiques panfrancophone » (revue Québec français, 134, 2004). Les pays ou régions de la Francophonie représentés dans le projet de Base de données lexicographiques panfrancophone sont les suivants : Acadie, Algérie, Belgique, Burundi, Centrafrique, Congo-Brazzaville, France, Louisiane, Madagascar, Maroc, Nouvelle-Calédonie, Québec, Île de La Réunion, Suisse, Tchad.

En amont de la Base de données lexicographiques panfrancophone : le « Trésor de la langue française au Québec (TLFQ) »

La Base de données lexicographiques panfrancophone a pour illustre prédécesseur le « Trésor de la langue française au Québec (TLFQ) ». Voici brièvement en quoi il consiste. « Le projet du TLFQ est l’héritier d’une tradition de recherche sur le français du Québec à l’Université Laval. Mentionnons les travaux de la Société du parler français au Canada, qui ont conduit à la publication du Glossaire du parler français au Canada, ceux de l’équipe de Gaston Dulong et de l’équipe de Thomas Lavoie, qui ont donné lieu à des répertoires des usages traditionnels sur le territoire du Québec et des régions voisines. Par rapport à ces travaux fondateurs, l’entreprise du TLFQ vise un objectif plus large, celui de proposer une synthèse historique du français québécois illustrée principalement à travers son vocabulaire. L’idée de ce projet ambitieux a été lancée par Marcel Juneau au début des années 1970. Juneau s’est rapidement entouré d’une équipe d’étudiantes et d’étudiants avec lesquels il a exploré la langue des documents anciens. En collaboration avec Micheline Massicotte et Claude Poirier, il entreprend de constituer un fichier lexical représentatif des usages caractéristiques du français au Québec depuis l’époque de la colonisation jusqu’à nos jours. S’ensuit une intense période de dépouillement de journaux, de textes littéraires et scientifiques, de manuscrits de radioromans et de téléromans, d’enregistrements oraux, d’archives notariales, etc., avec l’aide d’une équipe d’auxiliaires de recherche qui ont construit l’essentiel du Fichier lexical du TLFQ entre 1975 et 1990. Ce fichier papier contient aujourd’hui plus de 1 200 000 citations consignées sur autant de fiches.

Au début des années 1980, Claude Poirier prend la relève à la direction de l’entreprise et, sous sa direction, un volume de présentation de l’ouvrage est publié en 1985 par un groupe de professeures, professeurs, collaboratrices et collaborateurs qui s’est constamment renouvelé depuis les années 1970. La conception de l’ouvrage a continué à évoluer et, en 1998, une première édition du Dictionnaire historique du français québécois (DHFQ) était publiée aux Presses de l’Université Laval. L’équipe du TLFQ a, au cours de son cheminement, bénéficié de l’appui de chercheuses et de chercheurs de diverses disciplines et de divers pays. À partir de la fin des années 1990, le TLFQ a dirigé un important projet de bases de données lexicographiques panfrancophones sur Internet, auquel ont participé des équipes de vingt-deux pays ou régions de la francophonie. Vingt bases actuellement en ligne, dont la BDLP-Québec, constituent le fruit de ce travail original de grande envergure. Signe de la reconnaissance remarquable que ce projet a obtenue dans le domaine de la lexicographie, la BDLP est accessible depuis 2019 sur le site de l’Académie française, comme complément aux dictionnaires de l’Académie. Au début des années 2000, un projet de seconde édition du Dictionnaire historique du français québécois a été amorcé. Le chantier s’est poursuivi de façon plus ou moins intermittente jusqu’en 2020, où il a été relancé à la faveur d’un nouveau financement. L’ouvrage est disponible en ligne depuis mars 2023 et constitue une version revue et augmentée du DHFQ paru en 1998 » (source : « Trésor de la langue française au Québec / Présentation », n.d.). Au fil des ans, l’équipe du Trésor de la langue française au Québec (TLFQ) a produit des corpus et élaboré des outils de recherche qui sont rapidement devenus indispensables à quiconque s’intéresse à l’histoire du français en usage au Québec et ailleurs en Amérique du Nord.

Base de données lexicographiques du Québec (BDLP-Québec)

La Base de données lexicographiques du Québec (BDLP-Québec) s’inscrit dans le cadre d’un projet d’envergure internationale (Base de données lexicographiques panfrancophone) visant à constituer et à regrouper des bases représentatives du français de chacun des pays et de chacune des régions de la francophonie.

L’Index lexicologique québécois (ILQ)

L’Index lexicologique québécois (ILQ) relève près de 132 000 formes lexicales ayant fait l’objet d’une étude ou d’un commentaire depuis le milieu du XVIIIe siècle dans l’une ou l’autre des sources suivantes : glossaires, manuels de bon usage, listes de mots, dictionnaires, articles dans des revues, chroniques de langage, thèses, mémoires.

Fichier lexical informatisé (FLI)

Le Fichier lexical informatisé (FLI), c’est plus de 400 000 citations provenant de sources québécoises diverses (documents d’archives, manuscrits ou imprimés, journaux et magazines, textes littéraires et scientifiques, manuscrits de radioromans et de téléromans, enregistrements oraux, relevés d’enquêtes sur le terrain). Les citations couvrent une période qui commence avec les voyages de Jacques Cartier (XVIe siècle) et qui s’étend jusqu’au début du XXIe siècle (source : « Trésor de la langue française au Québec / Base de données », n.d.).

Quelques repères supplémentaires sur les bases de données

Le document intitulé « Terminology Databases – Bases de données terminologiques » comprend les intitulés d’instances en lien avec la lexicographie, la terminologie et les bases de données. Il est fourni en fin d’article à titre illustratif de l’étendue et de la variété des grandes structures internationales qui mènent des activités lexicographiques ou terminologiques. Ce document renvoie aux grandes catégories suivantes : bases de données documentaires ; agences des Nations unies ; organisations internationales non ONU ; organismes internationaux ; organismes nationaux (source : Tradulex, Association internationale pour la qualité en traduction).

 UNTERM (United Nations Multilingual Terminology Database)

 UNOGTerm (United Nations Office in Geneva Terminology Database)

 VINTARS (UN Vienna Internet Terminology And Reference System)

 Term Portal (Food and Agriculture Organization of the United Nations)

 UNESCOTERM (United Nations Educational, Scientific and Cultural Organization)

ILOTERM (International Labour Organization) 

TERMITE (International Telecommunication Union) 

METEOTERM (World Meteorological Organization)

 TourisTerm (World Tourism Organization)

GF Terminology (The Global Fund to Fight AIDS, Tuberculosis and Malaria) 

WTOTERM (World Trade Organization) 

TERMPOST (Union postale universelle) 

IATE – InterActive Terminology for Europe (24 languages – 24 langues)

Electropedia (International Electrotechnical Commission)

SILVATERM (International Union of Forest Research Organizations) 

PIARC Terminology – World Road Association (28 languages – 28 langues) 

Termsciences – Multidisciplinary Terminological Portal

 Base de données lexicographiques panfrancophone

TermiumPlus (Translation Bureau – Canada – Bureau de la traduction) 

Termdat (Base terminologique de la Confédération suisse)

Minéfiterm (Ministère des finances français)

FranceTerme (Tous les termes publiés au Journal officiel français) 

Grand dictionnaire terminologique (Office québécois de la langue française) 

TERMISTI, Microglossaires consultables

Le mot de la fin ? La lexicographie a-t-elle rendez-vous avec l’intelligence artificielle ?

Ces dernières années, les publications grand public ainsi que les revues spécialisées ont amplement vulgarisé la notion d’« intelligence artificielle ». Le Grand dictionnaire terminologique de l’Office québécois de la langue française définit comme suit la notion d’« intelligence artificielle » : « Domaine d’étude ayant pour objet la reproduction artificielle des facultés cognitives de l’intelligence humaine dans le but de créer des systèmes ou des machines capables d’exécuter des fonctions relevant normalement de celle-ci. L’intelligence artificielle touche à de nombreux domaines, comme les sciences cognitives et les mathématiques, et à diverses applications, notamment en reconnaissance des formes, en résolution de problèmes, en robotique, dans les jeux vidéo ainsi que dans les systèmes experts ». Il est utile de savoir que « L’Office québécois de la langue française [a élaboré] avec la collaboration de l’Institut des algorithmes d’apprentissage de Montréal, du Département d’informatique de l’Université de Sherbrooke et du Département de génie électrique et de génie informatique de l’Université Laval, un vocabulaire bilingue de 85 concepts liés à l’intelligence artificielle ». Édité en 2024, ce vocabulaire bilingue de 39 pages a pour titre « Une intelligence artificielle bien réelle : les termes de l’IA » et il est accessible gratuitement sur le Web.

Pour sa part, DataFranca vient de publier le lexique « Les 101 mots de l’intelligence artificielle : petit guide du vocabulaire essentiel de la science des données et de l’intelligence artificielle ». Réalisant que la terminologie relative à l’intelligence artificielle, l’apprentissage automatique et l’apprentissage profond était rare en français, l’organisme sans but lucratif DataFranca a réuni sur un site wiki plus de 5500 termes liés à ces champs d’activité. Une communauté francophone mondiale composée de nombreux scientifiques, terminologues et traducteurs a rédigé des milliers de fiches encyclopédiques qui ont été soumises à la révision par les pairs (source : datafranca.org).

Lors de la recherche documentaire ayant précédé la rédaction du présent article, « Prolégomènes à l’élaboration de la Base de données lexicographiques du créole haïtien », nous avons constaté qu’il y a relativement peu de documents traitant spécifiquement des applications de l’intelligence artificielle (IA) dans le champ de la lexicographie. Ainsi, les Éditions ENI présentent des extraits du livre de David Brenet paru le 19 mars 2024, « L’intelligence artificielle expliquée Des concepts de base aux applications avancées de l’IA », qui traite notamment de « la reconnaissance de la parole » et de « la traduction automatique en IA ». Les applications de l’intelligence artificielle dans le champ de la lexicographie sont pour nous un champ neuf et ouvert, qui devra être investigué à l’avenir. Il s’agira notamment de déterminer si l’intelligence artificielle est aujourd’hui mise à contribution dans la constitution et la gestion des bases de données, dans le processus de veille lexicographique, d’examen du corpus lexicographique étendu et d’élaboration de la nomenclature, ainsi qu’à l’étape du traitement lexicographique des entrées des dictionnaires et des lexiques créoles.

Montréal, le 15 avril 2024