Dans le cadre de notre recherche, nous avons adopté une définition formelle du mot composé (Silberztein M. 1990). Selon cette définition, le mot composé est une suite d'au moins deux mots simples qui est interrompue soit par un espace, soit par un signe de ponctuation. Par exemple : verres de contact, dessus-dessous, eau minérale. La distinction entre les mots simples et les mots composés s'effectue au niveau de l'orthographe. Le dictionnaire électronique des mots composés pour le grec moderne contient toutes les formes fléchies des mots composés et les informations morphologiques relatives à chaque forme. Ce dictionnaire contient des mots composés qui appartiennent aux catégories grammaticales suivantes : noms, adjectifs et adverbes. Les informations concernant la morphologie sont codifiés comme suit : m = genre masculin, f = genre féminin, n = neutre, s = singulier, p = pluriel, N = cas nominatif, G = cas génitif, A = cas accusatif, V = cas vocatif Les informations sur les catégories grammaticales sont codifiées comme suit : N = nom, A = adjectif, V = verbe, ADV = adverbes Le dictionnaire électronique des mots composés comprend, à ce stade, 27.000 mots composés qui correspondent à 110.000 formes fléchies. L'application du dictionnaire électronique au processus de traitement automatique des textes permet non seulement de reconnaître les formes générées des mots composés, mais également de donner des informations linguistiques sur chaque forme et leur catégorie grammaticale. Cliquez ici pour consulter un exemple du dictionnaire électronique des mots composés. |