Les grammaires formelles s'appuient sur la théorie des automates à états finis. Dans le cadre d'INTEX, les grammaires formelles sont composées d'automates ou transducteurs, d'informations morphologiques et syntaxiques.

Un automate à états finis représente à l'entrée des suites de mots sans produire d'informations à la sortie. Avec les automates à états finis, on ne peut reconnaître que les suites de mots d'un corpus.

Exemple d'automate à états finis :

Dans l'exemple ci-dessus, seules les suites lexicales sont reconnues, "κράτος της Ελλάδας" (état grec), "κράτος της Γαλλίας" (état français), "κράτος της Αγγλίας" (état anglais), etc., sans aucune autre information.

Un transducteur est un automate à états finis qui représente à l'entrée des suites de mots et donne, à la sortie, de nouvelles informations (morphologiques, syntaxiques, sémantiques) sur la suite de mots.

Exemple de transducteur :

Dans l'exemple ci-dessus, les suites lexicales "κράτος της Ελλάδας" (état grec), "κράτος της Γαλλίας" (état français), "κράτος της Αγγλίας" (état anglais), etc., sont reconnues à l'entrée, et à la sortie, la catégorie syntaxique à laquelle elles appartiennent est précisée " GN " (groupe nominal).

Les grammaires formelles disponibles, à ce stade, concernent les ambiguïtés lexicales, les proverbes, les abréviations, les expressions de temps concernant les dates et le système numérique.

Exemple de grammaire formelle :

La grammaire formelle ci-dessus décrit les expressions de temps qui expriment l'heure en grec moderne. Elle comprend plusieurs situations (nœuds), celles en gris constituent des sous graphes (automates et transducteurs à états finis).

Par exemple, le sous-graphe DnumH24C est le suivant :