Études du lexique



I Lexique et vocabulaire

Lexique : ensemble des formes connues de façon active ou passive par un locuteur donné.

Vocabulaire : uniquement les formes connues activement par l'énonciateur.
Les vocabulaires sont aussi appelés des jargons. Ils sont utilisés dans un champ donné par un groupe social particulier. Le lexème devient alors un marqueur sociolinguistique.
 



 


Il existe des milliers d'unités lexicales, mais personne ne connaît la totalité de la langue française. Le vocabulaire courant, appelé vocabulaire fondamental, oscille entre 7000 et 8000 formes pour un locuteur donné.

On ne dispose pas tous de la même batterie lexicale mais tout le monde partage un vocabulaire général.

Il existe deux types d'opposition dans les lexiques :

Le vocabulaire passif correspond aux termes dont le locuteur connaît la définition mais qu'il n'utilise pratiquement pas, comme par exemple lexème pour un non linguiste.
Le vocabulaire actif correspond aux unités connues et employées par le locuteur. Certains termes spécialisés peuvent rentrer dans le vocabulaire courant (idiotie, imbécillité), alors certains termes courants peuvent se spécialiser dans certains vocabulaires techniques (souris)
 

Lexicologie : branche de la linguistique théorique qui étudie les lexèmes et le lexique.

Lexicographie : lexicologie appliquée à la confection des dictionnaires. Aujourd'hui, on parle aussi de dictionnairique.


II Tradition lexicographique et dictionnaires

En ce qui concerne les dictionnaires, il a toujours existé une lutte de tendances entre Historique de la lexicographie française à travers les siècles : Cette alternance reflète les deux grandes tendances lexicales.

Voir la partie du site consacrée aux dictionnaires.



III Le français fondamental

1954 : Georges Gougenheim enregistre des corpus de langue orale française et en fait une étude quantitative (statistique) sur le nombre d'occurrences des formes. Il établit une statistique des unités par ordre de fréquence. Les mots les plus fréquents sont sûrement les plus courants du lexique commun aux francophones.

On constate que les formes les plus fréquentes sont des morphèmes (déterminants, mots de relation, adverbes)

Les lexèmes les plus fréquents sont censés correspondre au français fondamental, mais on peut se demander pourquoi le mot non n'apparaît pas dans les termes les plus fréquents. En effet, il ne s'agit pas d'un corpus de discours polémique. On peut rétorquer à Gougenheim que le vocabulaire employé le plus fréquemment correspond à la réalité physico-culturelle des locuteurs.

Pour plus d'informations, voir le site : http://www.lexique.org/public/gougenheim.php 


IV Analyse sémique (= analyse componentielle)

En sémantique l'unité lexicale est considérée comme un sémème, c'est-à-dire un ensembles de traits sémantiques appelés sèmes : Il existe trois sortes de traits sémantiques :


 

Masque : objet qui cache le visage lors de fêtes costumées
- objet non animé (classème)
- qui cache les yeux (sème spécifique)
- et qui cache le visage (sémantème)
- lors de fêtes costumées (virtuème)

Seuls les traits distinctifs feront l'objet d'une analyse sémique en relation avec un champ sémantique d'unités. Les traits non distinctifs renvoient à la référence dans le monde et non plus à un champ d'unités linguistiques.

Les classèmes sont les sèmes distinctifs et obligatoires qui consistent en une particule de sens fondamentale :
 

Un sémème appartient toujours à un champ lexical. C'est-à-dire qu'il est apparenté sémantiquement à d'autres unités lexicales. Par exemple, le lexème père fera partie du même champ lexical que mère, fils, cousin...

On représente généralement l'analyse sémique des sémèmes d'un même champs lexical sous forme de matrice, selon le modèle proposé par Bernard Pottier (1968) :
 

SÈME

pour s'asseoir 

S1

pour une personne 
S2
avec dossier 

S3

avec bras 

S4

É

M

È

M

E

chaise
+
+
+
-
fauteuil
+
+
+
+
tabouret
+
+
-
-
canapé
+
-
+
ø

 

Hyperonymie / hyponymie
 

Les hyperonymes sont aussi appelés archisémèmes ou archilexèmes.
 
 



Pantonymie

Le phénomène consistant à désigner une notion en remontant jusqu'à un hyperonyme maximal est appelé pantonymie. En cela, des unités lexicales comme "truc", "machin", "chose", "bidule", qui permettent de renvoyer à des personnes, à des objets, ou à des notions plus abstraites sont considérées comme des pantonymes.

Synonymie

Il s'agit de co-hyponymes qui peuvent se commuter dans un même contexte sur l'axe syntagmatique et qui ont un nombre important de sèmes en commun. C'est le cas pour élève et étudiant :
 

SÈME

humain
  en apprentissage 
dans une institution scolaire
dans un établissement d'études supérieures

É

M

È

M

E

élève
+
+
+
-
étudiant
+
+
-
+

Cependant, il est très rare de trouver une synonymie totale de deux termes à l'intérieur d'une langue. Si cela arrive, on a généralement affaire à des différences de registres avec des implications sociolinguistiques. C'est le cas pour "chaussures" et "godasses" qui disposent des mêmes sèmes. Cependant le second sera ressenti comme relevant d'un registre familier.

Voir dictionnaire des synonymes de l'Université de Caen
http://elsap1.unicaen.fr/dicosyn.html

 

Antonymie

Les antonymes sont des co-hyponymes qui ont des sens opposés car ils contiennent les mêmes sèmes avec des valeurs positives et négatives inversées.

 

Les antonymes ont en fait un caractère très synonymique car ils ont un hyperonyme commun et contiennent les mêmes sèmes (même si leurs polarités sont inversées).
Il arrive d'ailleurs qu'une forme lexicale soit son propre antonyme, c'est le cas pour :

Polysémie

La polysémie correspond à la propriété qu'ont certaines unités lexicales d'avoir plusieurs sens :

Katz et Fodor proposent une analyse sémique du sémème "canard" sous forme d'arborescence dans la tradition générative transformationnelle :
 



 





C'est la mise en discours qui permettra de désambiguïser et de rendre les unités lexicales monosémiques. De polysémique en langue, le lexème devient monosémique en parole :
 



 


Il est très rare qu'une unité lexicale soit complètement monosémique en langue, sauf pour certains lexèmes faisant partie d'un vocabulaire très spécialisé :

Dans les autres cas, même si l'ambiguïté reste possible au moment de l'énonciation : La plupart du temps, le lexème polysémique passe en discours et se monosémise : Le réseau qui s'établit entre certaines unités lexicales au moment de la contextualisation sera appelé isotopie. Par exemple :

- entre canard et biologiste, il existe une isotopie animale,
- alors qu'entre canard et saxophoniste, l'isotopie est musicale.

C'est donc le phénomène isotopique qui fait que le lexème se monosémise en discours.
 

Homonymie

Il ne faut pas confondre la polysémie avec l'homonymie qui correspond à des sémèmes qui se prononcent et s'orthographient de la même façon mais qui n'ont aucun sème en commun.
Il n'y a pas de lien logique entre deux homonymes. Ils viennent, la plupart du temps, d'étymons différents et ne peuvent pas apparaître dans le même contexte.

Exemple : avocat

  1. homme de loi, conseiller juridique et défenseur (du latin advocatus)
  2. fruit de l'avocatier (de l'espagnol avocado)

Cependant le critère étymologique n'est pas forcément le plus fiable. Du point de vue diachronique, il arrive qu'un polysème se transforme en deux homonymes.

C'est le cas d'un terme comme grève qui aujourd'hui renvoie à deux sens bien différents :

  1. bord de l'eau
  2. action sociale
On a oublié que ces deux lexèmes ont une origine commune. Au siècle dernier, les ouvriers arrêtaient le travail et se réunissaient en masse sur la Place de Grève au bord de la Seine à Paris, devenue depuis la Place de l'Hôtel de Ville. On disait alors que les ouvriers faisaient grève. L'expression est restée mais l'origine en a été oubliée.

Il en va de même pour la forme voler :

  1. se déplacer dans l'air
  2. s'emparer d'un bien qui ne vous appartient pas

Or, on a oublié que le second sens provient à l'origine du premier. Au douzième siècle, voler signifiait pour un faucon qu'il poursuivait un petit oiseau pour le chasser. Aujourd'hui les locuteurs francophones ne reconnaissent aucun sème commun à ces deux emplois qui donnent lieu à deux entrées différentes dans les dictionnaires.

Les parfaits homonymes ont pour propriété d'être à la fois homophones et homographes :
 
 

Les homophones ne sont pas de parfaits homonymes s'ils ne sont pas homographes et vice versa :


Paronymie

Les paronymes sont des lexèmes dotés d'une similitude formelle mais qui sont sémantiquement distincts.

Cette ressemblance des formes a des conséquences sémantiques. La distinction de sens n'est plus aussi accusée et il y a une tendance latente à une sorte de fusion allant vers un polysème.

Ainsi,

un jour ouvrable

n'est pas un jour où les magasins sont ouverts, comme le pensent la plupart des gens, mais un jour où on travaille ; ouvrable a la même origine que ouvrage, le verbe ouvrer (travailler, en ancien français).
 

V Liens logiques

Ils existe des relations logico-sémantiques entre les sémèmes. Il en existe quatre types principaux :

Ces relations sont marquées par une terminologie venant de la rhétorique. La relation analogique est appelée MÉTAPHORE. On regroupe les trois autres sous l'appellation de MÉTONYMIE : procédé consistant à prendre un mot pour un autre auquel il est lié par un rapport logique de contiguïté.

Il existe plusieurs sortes de rapports logiques:

Cette relation s'établit de façon aléatoire : pourquoi un canard désignerait-il une fausse note plutôt qu'un corbeau.

La logique topologique est très empirique. Toutes ces implicitations sont aléatoires. Seuls certains virtuèmes sont sélectionnés.

Il s'agit d'un rapport de subordination sur l'axe paradigmatique. Il se distingue en cela de la métonymie stricte qui relève, selon Jakobson, d'un rapport de coordination entre deux notions sur l'axe syntagmatique (cause à effet, matière à objet).
 
  L'ANTONOMASE relève à la fois de la métaphore (analogie) et de la synecdoque (le prototype d'un ensemble). C'est un procédé qui consiste à employer un nom propre comme un nom commun pour désigner un individu particulier comme appartenant à un groupe caractériel typique.

Ces glissements sémantiques d'extension et de restriction sont beaucoup plus stricts que les phénomènes aléatoires.



VI La théorie Sapir-Whorf

Edward Sapir et Benjamin Lee Whorf sont deux ethnolinguistes américains qui ont travaillé sur les langues amérindiennes entre les années 1930 et 1940. Le premier a d'abord émis l'hypothèse qu'à langue et bassins linguistiques différents correspondaient des représentations du monde différentes. Le bassin lexical dont on dispose organise la représentation du monde. Chaque langue véhicule une vision du monde (Weltanschauung pour reprendre l'expression de Wilhelm von Humbolt, philosophe allemand du XIXe siècle).
 

Benjamin Lee Whorf reprend empiriquement cette hypothèse à travers l'étude du hopi, langue amérindienne qui n'a pas de marqueurs morphologiques temporels. Le temps n'est pas envisagé dans son déroulement et le mot jour n'a pas de pluriel. Au lieu de :

un Hopi dira : Selon lui le fait que le temps n'est marqué que par des représentations aspectuelles et modales implique que le peuple hopi vit dans un éternel présent.

On peut donc résumer l'hypothèse Sapir-Whorf en deux grands points :

1. Le langage est un produit socio-historique qui réorganise la vision du monde.

     
    KNIGHT
    signifie originairement celui qui est lié
    (le vassal). 
    CHEVALIER
    signifie celui qui est à cheval
     

    Les Germains considéraient le chevalier de l'intérieur, selon sa fonction, comme un serviteur attaché au roi, dont il porte les armes. Les Gallo-Romains ayant subi la conquête des Germains voyaient de l'extérieur les vassaux du roi. N'ayant pas de tradition féodale, ils ont appréhendé le personnage du chevalier à travers son activité et non sa fonction.

     

2. Les locuteurs vont découper la réalité différemment en fonction du bassin linguistique dans lequel ils ont été élevés.

En effet, là où un locuteur français ne percevra qu'une couleur, un locuteur polonais en percevra deux :
 
 
 
 


 

Par ailleurs, les francophones voient en une chaise et un fauteuil deux meubles bien distincts, alors que pour les anglophones armchair, tout comme wheelchair (chaise roulante), est un hyponyme de chair (chaise).
 



 





Toutefois, cette idée de vision du monde construite par la langue est contestable à plusieurs niveaux :


VII Lexique en contexte et lexique en discours selon les linguistiques énonciatives.

Benveniste a été le premier à contester l'idée qu'il existe une opposition ferme entre une signification inhérente aux lexèmes et des sens obtenus en contexte. En linguistique énonciative, on pense qu'il s'agit plus d'un continuum avec une transformation graduelle des notions.

Même s'il existe bien une certaine stabilité (ex. rouge est la même couleur pour tous les francophones), l'inhérence est beaucoup plus instable qu'il n'y parait.

Dans rouge sang la couleur semble plus altérée que dans sang rouge

De plus, les lexèmes peuvent changer de sens dans le même texte. Il y a alors un phénomène de diaphore, autrement dit, un rajustement sémantique graduel d'une unité lexicale dans un contexte défini.

Si on parle d'une rencontre qu'on a faite et qu'on en donne les détails, le terme rencontre se charge petit à petit des éléments fournis et n'a plus le même sens à la fin de la conversation qu'au début.

De même, un mot comme misérables se charge de sens au fur et à mesure de la lecture du roman Les Misérables de Victor Hugo.

En fait, les lexèmes prennent une charge spécifique dans leurs définitions à cause de ce qui est fourni contextuellement. S'ils renvoient souvent à des propriétés physico-culturelles relativement stables, celles-ci sont susceptibles de déformabilité.



VIII La notion de prototype

En sémantique cognitive, et notamment en linguistique énonciative, plutôt que de faire une analyse en sèmes discrets, on préfère dire que l'unité lexicale est repérée graduellement par rapport à un prototype.
Le prototype correspond à l'élément qui représente le mieux la classe, celui qui vient le plus rapidement à l'esprit à cause de ses propriétés physico-culturelles.

Par exemple, il y a de fortes chances pour qu'un citadin considère que la notion oiseau renvoie à un animal plutôt petit, qui a des plumes, qui vole, qui pond des oeufs et qui vit dans des arbres. Dans ce cas le moineau sera plus représentatif de la classe que la poule qui ne vit pas dans les arbres et qui ne vole pas. On construira alors un domaine notionnel, avec une frontière et un centre type vers lequel les éléments non typiques tendent ou dont ils s'éloignent. C'est ce qu'on appelle un repérage en intension ou en extension.
 


En ce qui concerne l'analyse du lexique, on est donc passé d'une analyse sémique discrète en langue à un repérage notionnel en continu effectué par l'énonciateur.
 

Vous retrouverez des notions liées à  la lexicologie et à la sémantique dans Le petit glossaire du sémanticien.
de L'espace virtuel de l'Equipe Sémantique des Textes sous la direction de François Rastier.

© Henriette Gezundhajt, Département d'études françaises, Université de Toronto, Université York à Toronto, 1998-2016
Toute reproduction sans autorisation, sous format électronique ou sur papier, et toute utilisation commerciale sont totalement interdites.
Si vous vous servez de ces pages dans un but didactique ou personnel,  n'oubliez pas d'en citer la source et, si possible, envoyez-moi un message.

Ces pages restent gratuitement à la disposition des visiteurs, cependant, si vous vous servez de ces pages pour votre enseignement ou pour votre recherche, une contribution financière de 15$ canadiens serait fortement appréciée.
Pour ce faire, vous pouvez utiliser votre carte de crédit dans le système PayPal en cliquant sur le bouton ci-dessous et en suivant les instructions (malheureusement en anglais) :