|
Des lexiques-grammaires sont utilisés dans des applications telles que l'extraction d'informations (Guarasci et al. 2020) et la fouille d'opinions (Elia et al. 2015). Ils permettent une formalisation des constructions syntaxiques qui a été proposée comme cadre de l'analyse syntaxique des phrases (De Bueriis, Langella, 2019).
Les lexiques-grammaires sont des bases de données lexicales construites par des linguistes (La Valley 2020; Mota et al. 2018). Un lexique-grammaire recense, en grandeur réelle, les structures syntaxiques élémentaires de ses entrées. Un lexique-grammaire des verbes et des autres éléments prédicatifs (adjectifs, noms et adverbes) a été
construit pour plusieurs langues sous la forme de tables de propriétés (exemple :
un extrait de la table 38LH). Ces
tables comportent un nombre significatif d'entrées (plusieurs milliers pour chaque langue).
Elles résultent de l'application d'un ensemble de principes linguistiques communs :
- les sens sont soigneusement distingués (exemples : manquer, place, voile)
sur la base de critères distributionnels et transformationnels ;
- la phrase élémentaire est l'unité minimale d'étude, et la forme de la phrase est réduite
à une forme prédicative et à un ensemble caractéristique d'arguments ;
- en particulier, on doit disposer de principes permettant de séparer les compléments essentiels
(sujets et objets) des compléments non essentiels (adverbiaux, compléments circonstanciels) ;
- un jeu de transformations syntaxiques est établi expérimentalement et testé sur
un vocabulaire étendu pour évaluer la reproductibilité des jugements d'acceptabilité (Elia et al. 2011).
Lorsque ces principes généraux sont respectés, l'expérience acquise
a prouvé que des individus ou équipes différents peuvent parvenir à des
évaluations identiques, ce qui assure la cumulativité des descriptions. Ce point est crucial
pour les méthodes symboliques de traitement des langues : la quantité de données qui
doivent être accumulées et représentées dans un modèle cohérent est telle que
de nombreuses équipes de recherche et développement ont à coopérer, et leurs
résultats doivent être tels qu'ils puissent être fusionnés sans qu'elles aient à
réécrire des parties substantielles de la grammaire et du lexique de chaque
langue. Réunir ces conditions n'est aucunement trivial : les projets de construction
de grammaires à structure de constituants non lexicalisées tendent à montrer que leur
construction n'est pas cumulative ; d'ailleurs, il n'existe pas d'exemple de telles grammaires qui
soit d'une taille significative et qui ne soit pas l'oeuvre d'un unique spécialiste.
La méthode du lexique-grammaire part de la construction de tables de propriétés,
au lieu de donner la priorité à la grammaire aux dépens du lexique. En effet, la
séparation entre grammaire et lexique dans la description linguistique est
contre-productive : il y a souvent plus de différences entre deux phrases que de traits communs,
c'est pourquoi les tentatives de faire des règles générales sont aussi souvent vaines.
Le cadre théorique qui a été adopté pour cette entreprise est celui des transformations
syntaxiques de Z.S. Harris. Le niveau de formalisation utilisé par cette théorie est
satisfaisant : des analyseurs syntaxiques ont été implémentés dès les années 1960.
La notion de lexique-grammaire est brièvement présentée dans The RELEX Network, Section 4.
Le terme de lexique-grammaire a été introduit par Annibale Elia en 1978. Les idées qui sont à l'origine
du lexique-grammaire ont été formulées par Maurice Gross au cours des années 1960 (M. Gross 1975).
Références en anglais sur le lexique-grammaire : 1968-2003,
2004-
Visualisation des tables du lexique-grammaire
Accueil
|